Relação empírica entre média, mediana e moda

40

Para uma distribuição unimodal moderadamente inclinada, temos a seguinte relação empírica entre média, mediana e modo: Como foi essa relação derivado?

(Média - Modo)3(Média mediana)

Karl Pearson planejou milhares desses relacionamentos antes de formar essa conclusão, ou existe uma linha lógica de raciocínio por trás desse relacionamento?

Sara
fonte

Respostas:

29

Indique a média ( média), a mediana, o desvio padrão e o modo. Finalmente, seja a amostra, uma realização de uma distribuição unimodal contínua para a qual existem os dois primeiros momentos.m σ M X FμmσMXF

É sabido que

(1)|μm|σ

Este é um exercício frequente de livro didático:

|μ-m|=|E(X-m)|E|X-m|E|X-μ|=E(X-μ)2E(X-μ)2=σ
O primeiro igualdade deriva da definição da média, a terceira ocorre porque a mediana é o minimizador único (entre todos os 's) de E | Xc | e o quarto da desigualdade de Jensen (isto é, a definição de uma função convexa). Na verdade, essa desigualdade pode ser reforçada. De fato, para qualquer F , que satisfaça as condições acima, pode ser mostrado [3] queE | X - c | FcE|X-c|F

2)|m-μ|0,6σ

Embora, em geral, não seja verdade ( Abadir, 2005 ) que qualquer distribuição unimodal deva satisfazer um dos , ainda é possível mostrar que o desigualdade

Mmμ ou Mmμ

(3)|μ-M|3σ

vale para qualquer distribuição integrável quadrada e unimodal (independentemente da inclinação). Isso é provado formalmente em Johnson e Rogers (1951), embora a prova dependa de muitos lemas auxiliares que são difíceis de ajustar aqui. Vá ver o papel original.


Uma condição suficiente para uma distribuição satisfazer é dada em [2]. Se :μ m M FFμmMF

(4)F(mx)+F(m+x)1 for all x

em seguida, . Além disso, se , a desigualdade é estrita. As distribuições de Pearson Tipo I a XII são um exemplo de família de distribuições satisfatórias [4] (por exemplo, o Weibull é uma distribuição comum para a qual não é válida, consulte [5]).μ m ( 4 ) ( 4 )μmMμm(4)(4)

Agora, assumindo que mantém estritamente e wlog que , temos σ = 1 3 ( m - μ ) ( 0 , 3 (4)σ=1

3(m-μ)(0 0,30,6] e M-μ(m-μ,3]

e como o segundo desses dois intervalos não está vazio, certamente é possível encontrar distribuições para as quais a asserção é verdadeira (por exemplo, quando ) para alguma faixa de valores dos parâmetros da distribuição, mas isso não é verdadeiro para todas as distribuições e nem mesmo para todas as distribuições satisfatórias .(4)0 0<m-μ<33<σ=1(4)

  • [0]: O problema do momento para distribuições unimodais. NL Johnson e CA Rogers. Os Anais de Estatística Matemática, vol. 22, n. 3 (setembro de 1951), pp. 433-439
  • [1]: A desigualdade no modo médio-mediano: contra-exemplos Karim M. Abadir Econometric Theory, vol. 21, nº 2 (abril de 2005), pp. 477-482
  • [2]: WR van Zwet, Média, mediana, modo II, Estatista. Neerlandica, 33 (1979), pp.
  • [3]: A média, mediana e modo de distribuição unimodal: uma caracterização. S. Basu e A. DasGupta (1997). Teoria Probab. Appl. 41 (2), 210-223.
  • [4]: Algumas observações sobre média, mediana, modo e assimetria. Michikazu Sato. Jornal Australiano de Estatística. Volume 39, Edição 2, páginas 219–224, junho de 1997
  • [5]: PT von Hippel (2005). Média, mediana e inclinação: corrigindo uma regra de livro didático. Journal of Statistics Education Volume 13, Número 2.
user603
fonte
Sinto muito, sou apenas um estudante de matemática do primeiro ano. Você poderia fornecer / recomendar um link / livro / artigo que descreve como o relacionamento foi derivado?
Sara
3
@ Sara Eu acho que remonta a Karl Pearson, que usa esse relacionamento empírico por sua "distorção do modo Pearson". Além disso, você pode achar interessante este artigo online, j.mp/aWymCv .
quer
Obrigado chl e kwak pelo link e pela resposta que você forneceu. Eu os estudarei.
Sara
2
Vários pontos:é minimizado quando é a mediana de . O artigo de Von Hippel ( link acima por chl) discute exceções e btinternet.com/~se16/hgb/median.htm mostra a possível relação entre média, mediana, modo e desvio padrão, tanto para distribuições contínuas quanto para discretas. Os 3 podem de fato ter qualquer valor: positivo, negativo, zero ou infinito. k XE|X-k|kX
Henry
1
Pode ser que eu esteja sendo um pouco densa (não seria a primeira vez). Você pode esclarecer comosegue de (1) e (3)? |M-μ|3|μ-m|
Glen_b -Reinstala Monica
9

O artigo chl aponta para informações importantes - mostrando que ela não é próxima de uma regra geral (mesmo para variáveis ​​contínuas, suaves e "bem comportadas", como o Weibull). Portanto, embora possa ser aproximadamente verdadeiro, geralmente não é.

Então, de onde vem Pearson? Como ele chegou a essa aproximação?

Felizmente, Pearson nos diz a resposta.

O primeiro uso do termo "inclinação" no sentido em que estamos usando parece ser Pearson, 1895 [1] (aparece exatamente no título). Este documento também parece ser o local onde ele introduz o termo modo (nota de rodapé, p345):

Achei conveniente usar o termo modo para as abcissas correspondentes às ordenadas de frequência máxima. O "médio", o "modo" e a "mediana" têm todos os caracteres distintos importantes para o estatístico.

Também parece ser seu primeiro detalhamento real de seu sistema de curvas de frequência .

Portanto, ao discutir a estimativa do parâmetro de forma na distribuição Pearson Tipo III (o que chamamos agora de gama deslocada - e possivelmente invertida), ele diz (p375):

p

>1

x

E, de fato, se observarmos a proporção de (modo médio) para (média mediana) para a distribuição gama, observaremos o seguinte:

insira a descrição da imagem aqui

(A parte azul marca a região em que Pearson diz que a aproximação é razoável).

αβ

insira a descrição da imagem aqui

β-α=kβ-ααβ-ααββ+α=cβ+ααβ

α>10

insira a descrição da imagem aqui

eμ-σ2,eμeμ+σ2/2

eμeσ2/2-e-σ2eσ2/2-1σ232σ212σ2σ2

Há um número razoável de distribuições conhecidas - muitas das quais a Pearson estava familiarizada -, das quais é quase verdade para uma ampla gama de valores de parâmetros; ele notou isso com a distribuição gama, mas teria a ideia confirmada quando viesse a examinar várias outras distribuições que provavelmente consideraria.

[1]: Pearson, K. (1895),
"Contribuições para a Teoria Matemática da Evolução, II: Variação Inclinada em Material Homogêneo",
Transações Filosóficas da Royal Society, Série A, 186, 343-414
[Fora dos direitos autorais. Disponível gratuitamente aqui ]

Glen_b -Reinstate Monica
fonte
4

Esse relacionamento não foi derivado. Percebeu-se que ele mantinha aproximadamente distribuições quase simétricas empiricamente . Veja a exposição de Yule em A introdução à teoria da estatística (1922), p.121, capítulo VII, seção 20. Ele apresenta o exemplo empírico.

Aksakal
fonte
De fato, minha citação de Pearson 1895 indica que é algo que ele notou e não derivou.
Glen_b -Reinstala Monica
2
Textos de matemática de idade são muito mais divertido de ler do que escrever de hoje
Aksakal