existe alguma ferramenta de arrumação de dados para python / pandas semelhante à ferramenta R tidyr?

18

Estou trabalhando em um desafio do Kaggle, em que algumas variáveis ​​são representadas por linhas em vez de colunas (interrupção da rede Telstra). Atualmente, estou procurando o equivalente a gather (), separado () e spread (), que pode ser encontrado na ferramenta R tidyr.

cpumar
fonte

Respostas:

3

Os R's gather()vão basicamente de amplos a longos. Então,

  1. verifique a página dos pandas para saber como usar pandas.wide_to_long(),
  2. consulte este blog para obter uma discussão sobre como obter uma gatherfunção elegante no Python.
ximiki
fonte
0

Tentei imitar sintaticamente o pacote tidyr em python em um pacote chamado tidypython. Tornei-o compatível com o pacote dplython, que inclui o uso do operador >> para encadear comandos.

Não foi totalmente testado, mas deve funcionar muito bem:

https://github.com/durrantmm/tidypython

Deixe-me saber se funciona para você.

Matt Durrant
fonte