Cálculo da média aritmética (um tipo de média) em Python

268

Existe um método de biblioteca interno ou padrão no Python para calcular a média aritmética (um tipo de média) de uma lista de números?

jrdioko
fonte
Média é ambígua - moda e mediana também são médias comumente usados
jtlz2
Modo e mediana são outras medidas de tendência central. Eles não são médias. O modo é o valor mais comum visto em um conjunto de dados e não é necessariamente exclusivo. A mediana é o valor que representa o centro dos pontos de dados. Como a pergunta indica, existem alguns tipos diferentes de médias, mas todos são diferentes dos cálculos de mediana e modo. purplemath.com/modules/meanmode.htm
Jarom
@Jarom Esse link não concorda com você: 'Média, mediana e modo são três tipos de "médias"'
Marcelo Cantos

Respostas:

285

Não estou ciente de nada na biblioteca padrão. No entanto, você pode usar algo como:

def mean(numbers):
    return float(sum(numbers)) / max(len(numbers), 1)

>>> mean([1,2,3,4])
2.5
>>> mean([])
0.0

Em entorpecido, há numpy.mean().

NPE
fonte
20
Uma coisa comum é considerar que a média de []é 0, o que pode ser feito por float(sum(l))/max(len(l),1).
jan
8
O PEP 8 diz que esse lé um nome de variável incorreto porque se parece muito com ele 1. Além disso, eu usaria if lao invés de if len(l) > 0. Veja aqui
zondo
1
Por que você ligou max?
1 --_-
3
Veja a pergunta acima: Para evitar a divisão por zero (para [])
Simon Fakir 27/07
5
Listas vazias não têm significado. Por favor, não finja que sim.
Marcelo Cantos
193

NumPy tem uma numpy.meanmédia aritmética. O uso é tão simples quanto isto:

>>> import numpy
>>> a = [1, 2, 4]
>>> numpy.mean(a)
2.3333333333333335
Bengt
fonte
6
numpy é um pesadelo para instalar em um virtualenv. Você realmente deve considerar não usar esta lib
vcarel
46
@ vcarel: "numpy é um pesadelo para instalar em um virtualenv". Não sei por que você diz isso. Costumava ser o caso, mas durante o último ano ou mais tem sido muito fácil.
6
Devo secundar esse comentário. Atualmente, estou usando numpy em uma virtualenv no OSX e não há absolutamente nenhum problema (atualmente usando o CPython 3.5).
Juan Carlos Coto
4
Com sistemas de integração contínua como o Travis CI, a instalação do numpy leva vários minutos extras. Se a construção rápida e leve é ​​valiosa para você e você precisa apenas da média, considere.
Akseli Palén 7/03
2
Os ambientes virtuais do @ AkseliPalén no Travis CI podem usar um número instalado via apt-get usando os pacotes de sites do sistema . Isso pode ser rápido o suficiente para usar, mesmo que seja necessário apenas uma média.
Bengt 25/03
184

Use statistics.mean:

import statistics
print(statistics.mean([1,2,4])) # 2.3333333333333335

Está disponível desde o Python 3.4. Para 3.1-3.3 usuários, uma versão antiga do módulo está disponível em PyPI sob o nome stats. Apenas mude statisticspara stats.

kirbyfan64sos
fonte
2
Observe que isso é extremamente lento quando comparado às outras soluções. Compare timeit("numpy.mean(vec)), timeit("sum(vec)/len(vec)")e timeit("statistics.mean(vec)")- o último é mais lento do que os outros por um fator enorme (> 100 em alguns casos no meu PC). Isso parece dever-se a uma implementação particularmente precisa do sumoperador statistics, consulte PEP e Código . Não tenho certeza sobre o motivo da grande diferença de desempenho entre statistics._sume numpy.sum, no entanto.
Jhin
10
@ jhin isso ocorre porque as statistics.meantentativas estão corretas . Calcula corretamente a média de [1e50, 1, -1e50] * 1000.
Antti Haapala
1
statistics.meantambém aceitará uma expressão geradora de valores, na qual todas as soluções usadas len()para o divisor serão bloqueadas.
PaulMcG 28/08/19
54

Você nem precisa de entorpecentes ou esquisitos ...

>>> a = [1, 2, 3, 4, 5, 6]
>>> print(sum(a) / len(a))
3
Mumon
fonte
24
então médio ([2,3]) daria 2. cuidado com carros alegóricos. Melhor usar float (soma (l)) / len (l). Melhor ainda, tenha cuidado para verificar se a lista está vazia.
Jesusiniesta # 25/13
14
@jesusiniesta exceto em python3, onde a divisão faz o que se pretende fazer: dividir
Yota
11
E em Python 2.2 + se from __future__ import divisionno topo do seu programa
spiffytech
E quanto a grandes números e excesso?
obayhan
Que tal a = list()? O código proposto resulta em ZeroDivisionError.
Ioannis Filippidis 07/09/16
7

Em vez de transmitir para flutuar, você pode fazer o seguinte

def mean(nums):
    return sum(nums, 0.0) / len(nums)

ou usando lambda

mean = lambda nums: sum(nums, 0.0) / len(nums)

ATUALIZAÇÕES: 2019-12-15

O Python 3.8 adicionou a função fmean ao módulo de estatísticas . O que é mais rápido e sempre retorna flutuação.

Converta dados em flutuadores e calcule a média aritmética.

Isso roda mais rápido que a função mean () e sempre retorna um float. Os dados podem ser uma sequência ou iteráveis. Se o conjunto de dados de entrada estiver vazio, gera um StatisticsError.

fmean ([3.5, 4.0, 5.25])

4,25

Novo na versão 3.8.

Vlad Bezden
fonte
2
from statistics import mean
avarage=mean(your_list)

por exemplo

from statistics import mean

my_list=[5,2,3,2]
avarage=mean(my_list)
print(avarage)

e o resultado é

3.0
fariborz najafi
fonte
1
def avg(l):
    """uses floating-point division."""
    return sum(l) / float(len(l))

Exemplos:

l1 = [3,5,14,2,5,36,4,3]
l2 = [0,0,0]

print(avg(l1)) # 9.0
print(avg(l2)) # 0.0
jasonleonhard
fonte
1
def list_mean(nums):
    sumof = 0
    num_of = len(nums)
    mean = 0
    for i in nums:
        sumof += i
    mean = sumof / num_of
    return float(mean)
Muhoza yves
fonte
0

Eu sempre acho que avgé omitido do builtins / stdlib porque é tão simples quanto

sum(L)/len(L) # L is some list

e quaisquer advertências já seriam abordadas no código de chamada para uso local .

Advertências notáveis:

  1. resultado não flutuante: em python2, 9/4 é 2. para resolver, usar float(sum(L))/len(L)oufrom __future__ import division

  2. divisão por zero: a lista pode estar vazia. resolver:

    if not L:
        raise WhateverYouWantError("foo")
    avg = float(sum(L))/len(L)
n611x007
fonte
0

A resposta correta para sua pergunta é usar statistics.mean. Mas, por diversão, aqui está uma versão do mean que não usa a len()função, portanto (como statistics.mean) pode ser usada em geradores, que não suportam len():

from functools import reduce
from operator import truediv
def ave(seq):
    return truediv(*reduce(lambda a, b: (a[0] + b[1], b[0]), 
                           enumerate(seq, start=1), 
                           (0, 0)))
PaulMcG
fonte
-2

Outros já postaram respostas muito boas, mas algumas pessoas ainda podem estar procurando uma maneira clássica de encontrar o Mean (avg), então aqui eu posto isto (código testado no Python 3.6):

def meanmanual(listt):

mean = 0
lsum = 0
lenoflist = len(listt)

for i in listt:
    lsum += i

mean = lsum / lenoflist
return float(mean)

a = [1, 2, 3, 4, 5, 6]
meanmanual(a)

Answer: 3.5
Hashmatullah Noorzai
fonte