Qual "significa" usar e quando?

197

Portanto, temos média aritmética (AM), média geométrica (GM) e média harmônica (HM). Sua formulação matemática também é bem conhecida, juntamente com seus exemplos estereotipados associados (por exemplo, média harmônica e sua aplicação a problemas relacionados à "velocidade").

No entanto, uma pergunta que sempre me intrigou é "como decido qual meio é o mais apropriado para usar em um determinado contexto?" Deve haver pelo menos alguma regra prática para ajudar a entender a aplicabilidade e, no entanto, a resposta mais comum que me deparei é: "Depende" (mas de quê?).

Pode parecer uma pergunta bastante trivial, mas mesmo os textos do ensino médio não conseguiram explicar isso - eles apenas fornecem definições matemáticas!

Eu prefiro uma explicação em inglês do que uma matemática - um teste simples seria "sua mãe / criança entenderia?"

Doutorado
fonte
20
Talvez isso simplifique demais, mas eu sempre usei alcance e observações. Se o intervalo for o mesmo = AM (compare as pontuações de 0 a 100 e 0 a 100), se o intervalo for diferente, mas a observação for a mesma = GM (compare as pontuações de 1 a 5 e 0 a 10), se o intervalo for o mesmo, mas as observações são diferentes = HM (velocidade de um carro em diferentes obs, alturas de duas escadas, outras "taxas").
Brandon Bertelsen
> "Depende" (mas de quê?) Depende do algoritmo de processamento de dados.
Macson 20/10
Não é apenas uma escolha do que significa usar. Também é uma escolha de qual conjunto de estatísticas resumidas para descrever a população ou o processo de interesse. Não se deve pensar que tudo o que é necessário é um número único para descrever algo de talvez grande complexidade.
21918 JimB

Respostas:

160

Esta resposta pode ter uma inclinação um pouco mais matemática do que você estava procurando.

O importante a reconhecer é que todos esses meios são simplesmente o meio aritmético disfarçado .

A característica importante na identificação de qual (se houver algum!) Dos três meios comuns (aritmético, geométrico ou harmônico) é o meio "correto" é encontrar a "estrutura aditiva" na questão em questão.

Em outras palavras, suponha que recebamos algumas quantidades abstratas , que chamarei de "medições", abusando um pouco desse termo abaixo por uma questão de consistência. Cada um desses três meios pode ser obtido (1) transformando cada em algum , (2) tomando a média aritmética e depois (3) voltando à escala original de medição.x i y ix1,x2,,xnxiyi

Média aritmética : Obviamente, usamos a transformação "identidade": . Portanto, as etapas (1) e (3) são triviais (nada é feito) e .ˉ x A H = ˉ yyi=xix¯AM=y¯

Média geométrica : aqui a estrutura aditiva está nos logaritmos das observações originais. Então, pegamos e, em seguida, para obter o GM na etapa (3), convertemos de volta pela função inversa do , ou seja, . log ˉ x G M = exp ( ˉ y )yi=logxilogx¯GM=exp(y¯)

Média harmônica : aqui a estrutura aditiva está nos recíprocos de nossas observações. Portanto, , de onde .ˉ x H M = 1 / ˉ yyi=1/xix¯HM=1/y¯

Em problemas físicos, eles geralmente surgem pelo seguinte processo: Temos uma quantidade que permanece fixa em relação às nossas medidas e algumas outras quantidades, como . Agora, jogamos o seguinte jogo: Mantenha e constantes e tente encontrar alguns modo que, se substituirmos cada uma de nossas observações individuais por , o relacionamento "total" ainda será conservado .x 1 , , x n z 1wx1,,xn w z 1 + + z n ˉ x x i ˉ xz1,,znwz1++znx¯xix¯

O exemplo distância-velocidade-tempo parece popular, então vamos usá-lo.

Distância constante, tempos variados

Considere uma distância fixa percorrida . Agora, suponha que percorremos essa distância vezes diferentes nas velocidades , levando o tempo . Agora jogamos nosso jogo. Suponha que desejássemos substituir nossas velocidades individuais por alguma velocidade fixa modo que o tempo total permanecesse constante. Observe que temos modo que . Queremos que esse relacionamento total (tempo total e distância total percorrida) seja conservado quando substituímos cada um dos por em nosso jogo. Portanto, n v 1 , , v n t 1 , , t n ˉ v d - v i t i = 0dnv1,,vnt1,,tnv¯

dviti=0,
i(dviti)=0viv¯
ndv¯iti=0,
e como cada , obtemos que ti=d/vi
v¯=n1v1++1vn=v¯HM.

Observe que a "estrutura aditiva" aqui é relativa aos tempos individuais e nossas medidas são inversamente relacionadas a eles, portanto, a média harmônica se aplica.

Distâncias variáveis, tempo constante

ntv1,,vnd1,,dn

divit=0,
i(divit)=0v¯
i(div¯t)=0,
di=vit
v¯=1nivi=v¯AM.

Aqui a estrutura aditiva que estamos tentando manter é proporcional às medidas que temos, portanto a média aritmética se aplica.

Cubo de volume igual

Suponha que tenhamos construído uma caixa dimensional com um determinado volume e nossas medidas sejam os comprimentos laterais da caixa. Então e suponha que desejássemos construir um cubo (hiper) dimensional com o mesmo volume. Ou seja, queremos substituir nossos comprimentos laterais individuais por um comprimento lateral comum . Então nVn x

V=x1x2xn,
nxix¯
V=x¯x¯x¯=x¯n.

Isso indica facilmente que devemos usar .x¯=(xixn)1/n=x¯GM

Observe que a estrutura aditiva está nos logaritmos, ou seja, e estamos tentando conservar a quantidade à esquerda.logV=ilogxi

Novos meios do antigo

Como exercício, pense no significado do "natural" na situação em que você deixa as distâncias e os tempos variarem no primeiro exemplo. Ou seja, temos distâncias , velocidades e tempos . Queremos conservar a distância total e o tempo percorrido e encontrar uma constante para conseguir isso.v i t i ˉ vdivitiv¯

Exercício : Qual é o significado "natural" nesta situação?

cardeal
fonte
25
+1 Esta é uma ótima resposta. No entanto, acho que é incompleto de uma maneira importante: em muitos casos, o meio certo de usar é determinado pela pergunta que estamos tentando responder e não por qualquer estrutura matemática nos dados. Um bom exemplo disso ocorre na avaliação de riscos ambientais: as autoridades reguladoras desejam estimar a exposição total de uma população a contaminantes ao longo do tempo. Isso requer uma média aritmética ponderada adequadamente, embora os dados de concentração ambiental usualmente possuam uma estrutura multiplicativa . A média geométrica seria o estimador ou estimador errado.
whuber
7
@ whuber: (+1) Este é um excelente comentário. No caminho para construir uma resposta, tomei uma decisão decididamente não estatística, por isso estou feliz que você tenha mencionado isso. É um tópico digno de uma resposta completa ( dica ).
cardeal
9
@whuber: Também traz à tona o fato (talvez não intencionalmente), de que a análise estatística pode estar sujeita à supervisão de especialistas em domínio (ou, talvez no seu exemplo, até mesmo não especialistas), que desejam estimar algo significativo para o domínio, mas quase estatisticamente totalmente antinatural. O problema que encontrei lá no passado é que às vezes eles também querem ditar a maneira como a estimativa estatística é realizada! :)
cardeal
11
@ whuber: Seria muito apreciado se você pudesse adicionar esse ponto de vista à resposta também, com alguma elaboração. Honestamente, suas explicações são uma das melhores que eu já vi no Stats.SE!
PhD
3
O ótimo comentário de sempre da @whuber. Às vezes (talvez com frequência!) O meio certo de usar não é ; antes, a questão geralmente precisa ser ampliada para "que medida de tendência central devo usar?".
Peter Flom
43

Expandindo o excelente comentário de @Brandon (que eu acho que deveria ser promovido para responder):

A média geométrica deve ser usada quando você estiver interessado em diferenças multiplicativas. Brandon observa que a média geométrica deve ser usada quando os intervalos forem diferentes. Isso geralmente está correto. O motivo é que queremos igualar os intervalos. Por exemplo, suponha que os candidatos à faculdade sejam classificados com pontuação no SAT (0 a 800), média de notas no HS (0 a 4) e atividades extracurriculares (1 a 10). Se uma faculdade quisesse calcular a média e equalizar os intervalos (ou seja, o aumento de peso em cada qualidade em relação ao intervalo), a média geométrica seria o caminho a percorrer.

Mas isso nem sempre é verdade quando temos escalas com intervalos diferentes. Se estivéssemos comparando renda em diferentes países (incluindo países pobres e ricos), provavelmente não desejaríamos a média geométrica, mas a média aritmética (ou, mais provavelmente, a mediana ou talvez uma média aparada).

O único uso que eu vi para média harmônica é o de comparar taxas. Como exemplo: se você dirige de Nova York a Boston a 40 MPH e retorna a 60 MPH, sua média geral não é a média aritmética de 50 MPH, mas a média harmônica.

AM = HM =2 / ( 1 / 40 + 1 / 60 ) = 48(40+60)/2=502/(1/40+1/60)=48

para verificar se isso está correto neste exemplo simples, imagine que estão a 160 quilômetros de Nova York a Boston. Em seguida, o percurso leva 3 horas, o percurso para casa leva 2 horas, o total é 5 horas e a distância é de 240 milhas. 240/5=48

Peter Flom
fonte
3
Por que o seu exemplo SAT / GPA / extracurricular usa uma média geométrica em vez de uma média aritmética ponderada ou escalada? Por que um SAT ou GPA de zero significa que os outros dois valores se tornam irrelevantes (como uma média geométrica implicaria)? E se (digamos) as atividades extracurriculares tenderem a se agrupar em uma faixa muito mais estreita do que sua faixa teórica? Parece que faria mais sentido obter uma média aritmética de percentis (ou outros valores ajustados) do que uma média geométrica de valores brutos.
ruakh 20/02
11
@ruakh Interessante. O problema 0 realmente não importa nesse caso, pois o SAT e o GPA não podem ser 0 (o SAT = 0 é quase impossível e o GPA de 0 não se forma). Penso que uma média aritmética de percentis estará próxima da média geométrica em suas conclusões (mesmo que não nos números reais).
Peter Flom
31

Vou tentar resumir de três a quatro regras gerais e fornecer mais alguns exemplos dos meios pitagóricos.

A relação entre as três médias é HM <GM <AM para dados não negativos com alguma variação . Eles serão iguais se e somente se não houver variação nos dados da amostra.

Para dados em níveis, use o AM. Os preços são um bom exemplo. Para proporções, use o GM. Retornos de investimentos, preços relativos como o índice Bloomberg Billy (o preço da estante Billy da Ikea em vários países em comparação com o preço dos EUA) e o índice de desenvolvimento humano da ONU são exemplos. HM é apropriado quando se lida com taxas. Aqui está um exemplo não automotivo, cortesia de David Giles :

Por exemplo, considere dados sobre "horas trabalhadas por semana" (uma taxa). Suponha que tenhamos quatro pessoas (observações de amostra), cada uma das quais trabalhando um total de 2.000 horas. No entanto, eles trabalham para diferentes números de horas por semana, da seguinte maneira:

Person      Total Hours       Hours per Week          Weeks Taken
1                  2,000                  40                   50
2                  2,000                  45                   44.4444
3                  2,000                  35                   57.142857
4                  2,000                  50                   40

Total:           8,000                                       191.587297

A média aritmética dos valores na terceira coluna é AM = 42,5 horas por semana. No entanto, observe o que esse valor implica. A divisão do número total de semanas trabalhadas pelos membros da amostra (8.000) por esse valor médio gera um valor de 188.2353 como o número total de semanas trabalhadas pelas quatro pessoas.

Agora olhe para a última coluna na tabela acima. De fato, o valor correto para o número total de semanas trabalhadas pelos membros da amostra é de 191,5873 semanas. Se calcularmos a Média Harmônica para os valores de Horas por Semana na terceira coluna da tabela, obteremos HM = 41,75642 horas (<AM) e dividir esse número em 8.000 horas nos fornecerá o resultado correto de 191,5873 para o número total de semanas trabalhadas. Aqui está um caso em que a média harmônica fornece a medida apropriada para a média da amostra.

David também discute a versão ponderada dos três meios, que aparecem nos índices de preços usados ​​para medir a inflação.

Um seqüestrador de lado:

Esses ROTs não são perfeitos. Por exemplo, muitas vezes acho difícil descobrir se algo é uma taxa ou uma proporção. Os retornos de um investimento são geralmente tratados como uma razão no cálculo das médias, mas também são uma taxa, pois são geralmente denominados em "x% por unidade de tempo". "Usar HM quando os dados estão em níveis por unidade de tempo" seria uma heurística melhor?

Se você quisesse resumir o Big Mac Index para os países do norte da Europa, usaria o GM?

Dimitriy V. Masterov
fonte
3
Alguns anos depois, mas você já encontrou uma resposta para sua pergunta: "Se você quisesse resumir o Índice Big Mac para os países do norte da Europa, usaria o GM?" ?
precisa saber é o seguinte
2
@StatsScared Não, mas isso faria uma boa pergunta!
Dimitriy V. Masterov 26/01
7

Uma possível resposta para sua pergunta ("como eu decido qual média é a mais apropriada para usar em um determinado contexto?") É a definição de média, dada pelo matemático italiano Oscar Chisini .

Aqui está um artigo com uma explicação mais detalhada e alguns exemplos (velocidade média de viagem e outros).

Boscovich
fonte
6
Pode ser o ideal se você adicionar algumas linhas sobre a definição de Chisini aqui, caso o link fique inoperante, e / ou para ajudar os leitores a saber se desejam clicar no link para prosseguir com as idéias.
gung
2
De fato, o link para o jornal está morto. O link Wolfram não fornece nenhuma ideia de como a definição de Chisini é útil para determinar qual significa usar em um determinado contexto; parece-me apenas uma generalização matemática em oposição a uma prescrição de uso.
Ryan Simmons
11
Usando o DOI, pode-se ver que o documento foi movido para tandfonline.com. Citação: R. Graziani, P. Veronese (2009). Como calcular uma média? A abordagem Chisini e suas aplicações. The American Statistician 63 (1), pp. 33-36. tandfonline.com/doi/abs/10.1198/tast.2009.0006
akraf
0

Eu acho que uma maneira simples de responder à pergunta seria:

  1. Se a estrutura matemática for xy = k (uma relação inversa entre variáveis) e você estiver procurando uma média, precisará usar a média harmônica - que equivale a uma média aritmética ponderada - considere

Média harmônica = 2ab / (a ​​+ b) = a (b / a + b) + b (a / (a ​​+ b)

Por exemplo: a média dos custos em dólares se enquadra nessa categoria porque a quantidade de dinheiro que você está investindo (A) permanece fixa, mas o preço por ação (P) e o número de ações (N) variam (A = PN). De fato, se você pensa em uma média aritmética como um número igualmente centralizado entre dois números, a média harmônica também é um número igualmente centralizado entre dois números, mas (e isso é legal) o "centro" é onde as porcentagens (proporções) são igual. Ou seja: (x - a) / a = (b -x) / b, onde x é a média harmônica.

  1. Se a estrutura matemática é uma variação direta y = kx, você usa a média aritmética - que é a que a média harmônica se reduz nesse caso.
Ira Nirenberg
fonte
11
$x$x\frac{a}{b}ab
Digamos que você queira agrupar as probabilidades de vários modelos diferentes. Nesse caso, faz algum sentido usar meios geométricos ou harmônicos?
thecity2