Perguntas com a marcação «pandas»

89
Comparando dois dataframes e obtendo as diferenças

Eu tenho dois dataframes. Exemplos: df1: Date Fruit Num Color 2013-11-24 Banana 22.1 Yellow 2013-11-24 Orange 8.6 Orange 2013-11-24 Apple 7.6 Green 2013-11-24 Celery 10.2 Green df2: Date Fruit Num Color 2013-11-24 Banana 22.1 Yellow 2013-11-24 Orange 8.6 Orange 2013-11-24 Apple 7.6...

89
Python Pandas: group by in group by e Average?

Eu tenho um dataframe como este: cluster org time 1 a 8 1 a 6 2 h 34 1 c 23 2 d 74 3 w 6 Eu gostaria de calcular a média de tempo por organização por cluster. Resultado esperado: cluster mean(time) 1 15 ((8+6)/2+23)/2 2 54 (74+34)/2 3 6 Não sei fazer no Pandas, alguém pode ajudar?...

88
float64 com pandas to_csv

Estou lendo um CSV com números flutuantes como este: Bob,0.085 Alice,0.005 E importe para um dataframe e grave este dataframe em um novo lugar df = pd.read_csv(orig) df.to_csv(pandasfile) Agora isso pandasfiletem: Bob,0.085000000000000006 Alice,0.0050000000000000001 O que acontece?...

87
Pandas: como alterar todos os valores de uma coluna?

Eu tenho um quadro de dados com uma coluna chamada "Date"e quero que todos os valores desta coluna tenham o mesmo valor (apenas o ano). Exemplo: City Date Paris 01/04/2004 Lisbon 01/09/2004 Madrid 2004 Pekin 31/2004 O que eu quero é: City Date Paris 2004 Lisbon 2004 Madrid 2004 Pekin...

87
Pandas: média móvel por intervalo de tempo

Eu sou novo no Pandas ... Eu tenho um monte de dados de pesquisas; Quero calcular uma média móvel para obter uma estimativa para cada dia com base em uma janela de três dias. Pelo que entendi com essa pergunta , as funções rolling_ * calculam a janela com base em um número especificado de...