Eu converti um dataframe de pandas em uma saída html usando a DataFrame.to_html
função Quando eu salvo isso em um arquivo html separado, o arquivo mostra a saída truncada.
Por exemplo, na minha coluna TEXT,
df.head(1)
mostrará
O filme foi um excelente esforço ...
ao invés de
O filme foi um excelente esforço para desconstruir os complexos sentimentos sociais que predominaram nesse período.
Essa versão está correta no caso de um formato compatível com a tela de um grande dataframe de pandas, mas preciso de um arquivo html que mostre dados tabulares completos contidos no dataframe, ou seja, algo que mostre o último elemento de texto em vez do antigo snippet de texto.
Como eu seria capaz de mostrar os dados de texto completos e não truncados para cada elemento na minha coluna TEXT na versão html das informações? Eu imaginaria que a tabela html teria que exibir células longas para mostrar os dados completos, mas, pelo que entendi, apenas parâmetros de largura de coluna podem ser passados para a DataFrame.to_html
função.
None
como ilimitado.None
. Caso contrário, ocorrerá umValueError: Value must have type '<class 'int'>'
erro.max_columns
resposta funcionou para mim, que usaNone
como segundo argumento deset_option
.with pd.option_context('display.max_colwidth', -1): display(df)
id
(segundo argumento) pode mostrar completamente as colunas.fonte
max_colwidth
pode resolver o problema truncado causado por um campo com valores muito longos. No entanto, acho que os problemas truncados para a maioria das pessoas são realmente muitas colunas. Portanto, estemax_columns
deve ser o aceito.Enquanto
pd.set_option('display.max_columns', None)
define o número máximo de colunas mostradas, a opçãopd.set_option('display.max_colwidth', -1)
define a largura máxima de cada campo único.Para meus propósitos, escrevi uma pequena função auxiliar para imprimir totalmente grandes quadros de dados sem afetar o restante do código, também reformata os números flutuantes e define a largura da exibição virtual. Você pode adotá-lo para seus casos de uso.
fonte
Para aqueles que procuram fazer isso em dask. Não consegui encontrar uma opção semelhante no dask, mas se eu simplesmente fizer isso no mesmo notebook para pandas, também funcionará para o DASK.
fonte
O código a seguir resulta no erro abaixo:
FutureWarning: Passar um número inteiro negativo está obsoleto na versão 1.0 e não será suportado na versão futura. Em vez disso, use None para não limitar a largura da coluna.
Em vez disso, use:
Isso realiza a tarefa e está em conformidade com as versões do pandas após a versão 1.0.
fonte