Estou trabalhando em um desafio do Kaggle, em que algumas variáveis são representadas por linhas em vez de colunas (interrupção da rede Telstra). Atualmente, estou procurando o equivalente a gather (), separado () e spread (), que pode ser encontrado na ferramenta R tidyr.
18
Respostas:
Eu começaria com a função derretida () nos pandas. Eu escrevi um artigo sobre isso:
https://www.ibm.com/developerworks/community/blogs/jfp/entry/Tidy_Data_In_Python?lang=en
fonte
Os R's
gather()
vão basicamente de amplos a longos. Então,pandas.wide_to_long()
,gather
função elegante no Python.fonte
Tentei imitar sintaticamente o pacote tidyr em python em um pacote chamado tidypython. Tornei-o compatível com o pacote dplython, que inclui o uso do operador >> para encadear comandos.
Não foi totalmente testado, mas deve funcionar muito bem:
https://github.com/durrantmm/tidypython
Deixe-me saber se funciona para você.
fonte