Nos dados inclinados para a esquerda, qual é a relação entre média e mediana?

12

Eu acho que a mediana média.

É esse o caso?

Kunjan Kshetri
fonte
2
Que curso aberto do MOOC é esse? O que os materiais do curso sugerem que a resposta deva ser?
Glen_b -Reinstala Monica
1
class.stanford.edu/courses/Medicine/HRP258/… . O curso acabou.
Kunjan Kshetri
1
Obrigado, isso é algum contexto, pelo menos, embora tudo o que resta sejam leituras semanais que não lançem muita luz sobre esse assunto. Eu me pergunto o que o curso tinha a dizer sobre o assunto.
Glen_b -Reinstala Monica

Respostas:

16

É uma pergunta não trivial (certamente não tão trivial quanto as pessoas que fazem a pergunta parecem pensar).

A dificuldade é finalmente causada pelo fato de que realmente não sabemos o que queremos dizer com 'distorção' - muitas vezes é meio óbvio, mas às vezes não é. Dada a dificuldade de identificar o que queremos dizer com 'localização' e 'espalhar' em casos não triviais (por exemplo, a média nem sempre é o que queremos dizer quando falamos de localização), não deve ser uma grande surpresa que uma maneira mais sutil conceito como assimetria é pelo menos tão escorregadio. Portanto, isso nos leva a tentar várias definições algébricas do que queremos dizer, e elas nem sempre concordam entre si.

μμ

3(μμ)σ,
μ<μ

As versões de exemplo dessas estatísticas funcionam da mesma forma.

A razão para a necessária relação entre média e mediana nesse caso é porque é assim que a medida de assimetria é definida.

Aqui está uma densidade inclinada para a esquerda (pela segunda medida de Pearson e a medida mais comum em (2) abaixo):

enter image description here

A mediana é marcada na margem inferior em verde, a média em vermelho.

Então, espero que a resposta que eles querem que você dê é que a média é menor que a mediana. Geralmente é o caso dos tipos de distribuição a que costumamos dar nomes.

(Mas continue lendo e veja por que isso não está realmente correto como uma afirmação geral.)


2) Se você medi-lo no terceiro momento padronizado mais usual , geralmente é, mas nem sempre, o caso em que a média será menor que a mediana.

Ou seja, é possível construir exemplos onde o oposto é verdadeiro ou onde uma medida de assimetria é zero enquanto a outra é diferente de zero.

Ou seja, não é necessário relação entre os locais da média, mediana e a distorção do momento.

Considere, por exemplo, a seguinte amostra (o mesmo exemplo pode ser construído como uma distribuição de probabilidade discreta):

  2.7 15.0 15.0 15.0 30.0 30.0

mean: 17.95
median: 15

No entanto, o coeficiente de assimetria (Fisher, terceiro momento) é negativo (ou seja, por suas luzes, temos dados de inclinação à esquerda), pois a soma dos cubos dos desvios da média é negativa.

Portanto, nesse caso, incline para a esquerda, mas média> mediana.

(Por outro lado, se você alterar 2,7 no exemplo acima para 3, terá um exemplo em que a inclinação do momento é zero, mas a média excede a mediana. Se você fizer 3,3, a inclinação do momento será positiva e a média excede a mediana - ou seja, está finalmente na direção "antecipada".)

Se você usar a primeira assimetria de Pearson em vez de uma das definições acima, você terá um problema semelhante a este caso - a direção da assimetria não identifica a relação entre média e mediana em geral.


Editar: em resposta a uma pergunta nos comentários - um exemplo em que a média e a mediana são iguais, mas a inclinação do momento é negativa. Considere os seguintes dados (como antes, também conta como exemplo para uma população discreta; considere escrever os números nas faces de um dado).

 1  5  6  6  8 10

a média e a mediana são ambas 6, mas a soma dos cubos de desvios da média é negativa; portanto, a distorção do terceiro momento é negativa.

Glen_b -Reinstate Monica
fonte
1
@ Peter Desculpe pela resposta lenta, eu estava ocupado construindo apenas esses exemplos e não vi sua pergunta.
Glen_b -Reinstala Monica
2
Eu já vi muitas definições de livros didáticos e nenhuma mencionou isso. Legal.
Peter Flom - Restabelece Monica
6
@ Peter Infelizmente, muitos livros didáticos elementares simplesmente repetem informações incorretas de outros livros didáticos sem realmente fazer uma investigação real e, assim, um equívoco básico é propagado. Os contra-exemplos são, como você vê, relativamente fáceis de construir (eu apenas os faço à mão, conforme necessário). Kendall e Stuart ( Teoria Avançada de Estatística, Vol. I - não deixe o título te adiar, é bastante legível), pelo menos a terceira e quarta edições, têm boas informações. Edições mais recentes são de Stuart e Ord. Na verdade, eu postei sobre esse problema no CV várias vezes.
Glen_b -Reinstala Monica
4
Binômios (5k)0,8k0,25-k e (5k)0,2k0,85-k mostre isso =A mediana é perfeitamente consistente com a assimetria. Um ponto sobre esse exemplo é que ninguém pode convencê-lo de forma convincente como obscura ou patológica.
Nick Cox
1
@ Nick Sim, binômios com média inteira são ótimos exemplos.
Glen_b -Reinstala Monica
5

Não. Os dados inclinados à esquerda têm uma cauda longa à esquerda (extremidade inferior); portanto, a média geralmente será menor que a mediana. (Mas veja a resposta de @Glen_b para uma exceção). Casualmente, acho que os dados que "parecem" deixados distorcidos terão uma média menor que a mediana.

Dados inclinados à direita são mais comuns; por exemplo, renda. Lá, a média é maior que a mediana.

Código R

set.seed(123)  #set random seed
normdata <- rnorm(1000) #Normal data, skew = 0
extleft <- c(rep(-10, 5), rep(-20, 5)) #Some data to make skew left
alldata <- c(normdata,extleft)

library(moments)
skewness(alldata) #-6.77
mean(alldata) #-0.13
median(alldata) #-0.001
Peter Flom - Restabelece Monica
fonte
A média pode ser sempre igual à mediana?
Kunjan Kshetri
unj2 Adicionei um exemplo à minha resposta em que a assimetria do terceiro momento é negativa, mas média = mediana.
Glen_b -Reinstala Monica