Por que a média tende a ser mais estável em amostras diferentes do que a mediana?

22

A Seção 1.7.2 de Descobrindo estatísticas usando R por Andy Fields, et all, ao listar virtudes de média versus mediana, declara:

... a média tende a ser estável em diferentes amostras.

Depois de explicar as muitas virtudes da mediana, por exemplo,

... A mediana não é afetada por pontuações extremas nos dois extremos da distribuição ...

Dado que a mediana não é afetada por pontuações extremas, eu pensaria que fosse mais estável entre as amostras. Então fiquei intrigado com a afirmação dos autores. Para confirmar que eu executei uma simulação - eu gerei 1M de números aleatórios e fiz a amostragem de 100 números 1000 vezes e calculei a média e a mediana de cada amostra e depois calculei o dp dessas médias e medianas da amostra.

nums = rnorm(n = 10**6, mean = 0, sd = 1)
hist(nums)
length(nums)
means=vector(mode = "numeric")
medians=vector(mode = "numeric")
for (i in 1:10**3) { b = sample(x=nums, 10**2); medians[i]= median(b); means[i]=mean(b) }
sd(means)
>> [1] 0.0984519
sd(medians)
>> [1] 0.1266079
p1 <- hist(means, col=rgb(0, 0, 1, 1/4))
p2 <- hist(medians, col=rgb(1, 0, 0, 1/4), add=T)

Como você pode ver, os meios são mais bem distribuídos que as medianas.

insira a descrição da imagem aqui

Na imagem em anexo, o histograma vermelho é para medianas - como você pode ver, é menos alto e tem cauda mais gorda, o que também confirma a afirmação do autor.

Estou impressionado com isso, no entanto! Como a mediana mais estável tende a variar mais entre as amostras? Parece paradoxal! Quaisquer ideias serão apreciadas.

Alok Lal
fonte
1
Sim, mas tente por amostragem de nums <- rt (n = 10 ** 6, 1,1). Essa distribuição t1.1 fornecerá vários valores extremos, não necessariamente equilibrados entre positivo e negativo (uma chance tão boa de obter outro valor extremo positivo quanto um valor extremo negativo para equilibrar), que causará uma variação gigantesca em . É contra isso que a mediana protege. É improvável que a distribuição normal forneça valores especialmente extremos para estender a distribuição ˉ x mais que a mediana. x¯x¯
Dave
10
A afirmação do autor geralmente não é verdadeira. (Recebemos muitas perguntas aqui relacionadas a erros nos livros deste autor, portanto isso não é uma surpresa.) Os contra-exemplos padrão são encontrados entre as "distribuições estáveis" , nas quais a média é qualquer coisa, exceto "estável" (em qualquer sentido razoável de termo) e a mediana é muito mais estável.
whuber
1
"... a média tende a ser estável em diferentes amostras." é uma afirmação sem sentido. "estabilidade" não está bem definido. A média (amostra) é realmente bastante estável em uma única amostra porque é uma quantidade não aleatória. Se os dados são "instáveis" (altamente variáveis?), A média também é "instável".
AdamO 02/07
1
Essa pergunta provavelmente é respondida pelas análises detalhadas oferecidas em stats.stackexchange.com/questions/7307 , em que a mesma pergunta é feita de uma maneira específica (onde o sentido de "estável" é bem definido).
whuber
2
Tente substituir rnormpor rcauchy.
Eric Towers

Respostas:

3

A mediana é robusta ao ponto máximo, mas altamente suscetível a ruídos. Se você introduzir uma pequena quantidade de ruído em cada ponto, ele entrará na mediana sem amortecimento, desde que o ruído seja pequeno o suficiente para não alterar a ordem relativa dos pontos. Para o meio, é o contrário. A média de ruído é calculada, mas um único erro externo pode alterar a média arbitrariamente.

Seu teste mede principalmente a robustez ao ruído, mas você pode facilmente criar um onde a mediana tenha um desempenho melhor. Se você deseja um estimador robusto para discrepâncias e ruídos, basta jogar fora o terço superior e inferior e calcular a média do restante.

Rainer P.
fonte
Existe um nome mais específico para esse algoritmo do que "a média aparada de 33% "?
David Cary
25

Como @whuber e outros disseram, a afirmação não é verdadeira em geral. E se você estiver disposto a ser mais intuitivo - eu não consigo acompanhar os profundos geeks da matemática por aqui -, você pode ver outras maneiras pelas quais a média e a mediana são estáveis ​​ou não. Para esses exemplos, assuma um número ímpar de pontos para que eu possa manter minhas descrições consistentes e simples.

  1. Imagine que você espalhou pontos em uma linha numérica. Agora imagine que você pega todos os pontos acima do meio e os move até 10x seus valores. A mediana é inalterada, a média mudou significativamente. Portanto, a mediana parece mais estável.

  2. Agora imagine que esses pontos estão bem espalhados. Mova o ponto central para cima e para baixo. Um movimento de uma unidade altera a mediana em um, mas mal mudou a média. A mediana agora parece menos estável e mais sensível a pequenos movimentos de um único ponto.

  3. Agora imagine pegar o ponto mais alto e movê-lo sem problemas do ponto mais alto para o mais baixo. A média também se moverá suavemente. Mas a mediana não se moverá continuamente: ela não se moverá até que seu ponto alto fique mais baixo do que a mediana anterior, depois começará a seguir o ponto até ficar abaixo do próximo ponto, depois a mediana se manterá nesse ponto e novamente não mova-se à medida que continua movendo seu ponto para baixo. [Editado por comentário]

Portanto, transformações diferentes de seus pontos fazem com que a média ou a mediana pareçam menos suaves ou estáveis ​​em algum sentido. Os especialistas em matemática aqui mostraram as distribuições das quais você pode experimentar, o que mais se aproxima do seu experimento, mas espero que essa intuição também ajude.

Wayne
fonte
1
Em relação ao item 3: a mediana também não se moveria sem problemas? Digamos que o conjunto inicial de pontos seja [1, 3, 5, 7, 9]. Inicialmente, a mediana é 5. Essa permanecerá a mediana até o quinto ponto (inicialmente 9) cair abaixo 5, altura em que a mediana seguirá suavemente o quinto ponto à medida que diminui até atingir 3o ponto em que a mediana permanecerá 3. Portanto, mesmo que o ponto que define a mediana seja "pular" (do terceiro ponto ao quinto ponto e ao segundo ponto), o valor real da mediana não tem salto / descontinuidade.
Scott M
@ ScottM Você parece certo. Não sei por que pensei que iria pular. Vou reformular quando tiver uma chance.
Wayne
18

nμσ2<fmf~f~(z)=σf(μ+σz)zR. A variação assintótica da média e da mediana da amostra é dada respectivamente por:

V(X¯n)=σ2nV(X~n)σ2n14f~(mμσ)2.

Portanto, temos:

V(X¯n)V(X~n)4f~(mμσ)2.

n

V(X¯n)<V(X~n)ff~(mμσ)<12.

nf=1/2π=0.3989423<1/2

Restabelecer Monica
fonte
Impressionante! Obrigado.
Alok Lal
4

Comentário: Apenas para repetir sua simulação, usando uma distribuição para a qual SDs de médias e medianas têm o resultado oposto:

Especificamente, numsagora são de uma distribuição Laplace (também chamada de 'dupla exponencial'), que pode ser simulada como a diferença de duas distribuições exponenciais com a mesma taxa (aqui a taxa padrão 1). [Talvez veja a Wikipedia sobre distribuições de Laplace.]

set.seed(2019)
nums = rexp(10^6) - rexp(10^6)
means=vector(mode = "numeric")
medians=vector(mode = "numeric")
for (i in 1:10^3) { b = sample(x=nums, 10^2); 
  medians[i]= median(b); means[i]=mean(b) }
sd(means)
[1] 0.1442126
sd(medians)
[1] 0.1095946   # <-- smaller

hist(nums, prob=T, br=70, ylim=c(0,.5),  col="skyblue2")
 curve(.5*exp(-abs(x)), add=T, col="red")

enter image description here

Nota: Outra possibilidade fácil, mencionada explicitamente no link do @ whuber, é o Cauchy, que pode ser simulado como distribuição t de Student com um grau de liberdade rt(10^6, 1). No entanto, suas caudas são tão pesadas que fazer um bom histograma é problemático.

BruceET
fonte