Não consigo obter a média ou a média de uma coluna nos pandas. A tem um quadro de dados. Nenhuma das coisas que tentei abaixo me fornece a média da colunaweight
>>> allDF
ID birthyear weight
0 619040 1962 0.1231231
1 600161 1963 0.981742
2 25602033 1963 1.3123124
3 624870 1987 0.94212
O seguinte retorna vários valores, não um:
allDF[['weight']].mean(axis=1)
O mesmo acontece com isso:
allDF.groupby('weight').mean()
df.groupby('weight')
não era o que você queria, porque dividia o df em colunas separadas, cada uma com um valor distinto de peso. Em vez de apenasdf['weight'].mean()
Respostas:
Se você deseja apenas a média da
weight
coluna, selecione a coluna (que é uma série) e chame.mean()
:fonte
Tente
df.mean(axis=0)
, oaxis=0
argumento calcula a média das colunas do quadro de dados, para que o resultado seja igual àsaxis=1
linhas, para que você esteja obtendo vários valores.fonte
Tente tentar
print (df.describe())
. Espero que seja muito útil obter uma descrição geral do seu quadro de dados.fonte
display(df.describe())
é melhor (em Jupyter Notebooks) porquedisplay
do ipython fornece HTML formatado em vez de ASCII, o que é mais visualmente útil / agradável.você pode usar
você obterá estatísticas básicas do quadro de dados e, para obter média de uma coluna específica, poderá usar
fonte
Você também pode acessar uma coluna usando a notação de ponto (também chamada de acesso ao atributo) e, em seguida, calcular sua média:
fonte
Média para cada coluna em
df
:e se você quiser média de todas as colunas:
fonte
Além disso, se você deseja obter o
round
valor depois de encontrar omean
.fonte
Você pode usar uma das duas instruções abaixo:
fonte
fonte
Você pode simplesmente acessar: df.describe () que fornecerá todos os detalhes relevantes necessários, mas para encontrar o valor mínimo, máximo ou médio de uma coluna específica (por exemplo, 'pesos' no seu caso), use:
fonte