Eu tenho um dataframe como este:
cluster org time
1 a 8
1 a 6
2 h 34
1 c 23
2 d 74
3 w 6
Eu gostaria de calcular a média de tempo por organização por cluster.
Resultado esperado:
cluster mean(time)
1 15 ((8+6)/2+23)/2
2 54 (74+34)/2
3 6
Não sei fazer no Pandas, alguém pode ajudar?
df.groupby(['org','cluster']).mean()
? isso não é tão significativo para o seu conjunto de dados ao contrário disso:df.groupby(['cluster','org']).mean()
Respostas:
Se você quiser primeiro calcular a média na combinação
['cluster', 'org']
e, em seguida, considerar a média noscluster
grupos, você pode usar:Se você quiser apenas a média dos
cluster
grupos, poderá usar:Você também pode usar e,
groupby
em['cluster', 'org']
seguida, usarmean()
:fonte
Eu simplesmente faria isso, que segue literalmente a sua lógica desejada:
fonte