A Seção 1.7.2 de Descobrindo estatísticas usando R por Andy Fields, et all, ao listar virtudes de média versus mediana, declara:
... a média tende a ser estável em diferentes amostras.
Depois de explicar as muitas virtudes da mediana, por exemplo,
... A mediana não é afetada por pontuações extremas nos dois extremos da distribuição ...
Dado que a mediana não é afetada por pontuações extremas, eu pensaria que fosse mais estável entre as amostras. Então fiquei intrigado com a afirmação dos autores. Para confirmar que eu executei uma simulação - eu gerei 1M de números aleatórios e fiz a amostragem de 100 números 1000 vezes e calculei a média e a mediana de cada amostra e depois calculei o dp dessas médias e medianas da amostra.
nums = rnorm(n = 10**6, mean = 0, sd = 1)
hist(nums)
length(nums)
means=vector(mode = "numeric")
medians=vector(mode = "numeric")
for (i in 1:10**3) { b = sample(x=nums, 10**2); medians[i]= median(b); means[i]=mean(b) }
sd(means)
>> [1] 0.0984519
sd(medians)
>> [1] 0.1266079
p1 <- hist(means, col=rgb(0, 0, 1, 1/4))
p2 <- hist(medians, col=rgb(1, 0, 0, 1/4), add=T)
Como você pode ver, os meios são mais bem distribuídos que as medianas.
Na imagem em anexo, o histograma vermelho é para medianas - como você pode ver, é menos alto e tem cauda mais gorda, o que também confirma a afirmação do autor.
Estou impressionado com isso, no entanto! Como a mediana mais estável tende a variar mais entre as amostras? Parece paradoxal! Quaisquer ideias serão apreciadas.
rnorm
porrcauchy
.Respostas:
A mediana é robusta ao ponto máximo, mas altamente suscetível a ruídos. Se você introduzir uma pequena quantidade de ruído em cada ponto, ele entrará na mediana sem amortecimento, desde que o ruído seja pequeno o suficiente para não alterar a ordem relativa dos pontos. Para o meio, é o contrário. A média de ruído é calculada, mas um único erro externo pode alterar a média arbitrariamente.
Seu teste mede principalmente a robustez ao ruído, mas você pode facilmente criar um onde a mediana tenha um desempenho melhor. Se você deseja um estimador robusto para discrepâncias e ruídos, basta jogar fora o terço superior e inferior e calcular a média do restante.
fonte
Como @whuber e outros disseram, a afirmação não é verdadeira em geral. E se você estiver disposto a ser mais intuitivo - eu não consigo acompanhar os profundos geeks da matemática por aqui -, você pode ver outras maneiras pelas quais a média e a mediana são estáveis ou não. Para esses exemplos, assuma um número ímpar de pontos para que eu possa manter minhas descrições consistentes e simples.
Imagine que você espalhou pontos em uma linha numérica. Agora imagine que você pega todos os pontos acima do meio e os move até 10x seus valores. A mediana é inalterada, a média mudou significativamente. Portanto, a mediana parece mais estável.
Agora imagine que esses pontos estão bem espalhados. Mova o ponto central para cima e para baixo. Um movimento de uma unidade altera a mediana em um, mas mal mudou a média. A mediana agora parece menos estável e mais sensível a pequenos movimentos de um único ponto.
Agora imagine pegar o ponto mais alto e movê-lo sem problemas do ponto mais alto para o mais baixo. A média também se moverá suavemente. Mas a mediana não se moverá continuamente: ela não se moverá até que seu ponto alto fique mais baixo do que a mediana anterior, depois começará a seguir o ponto até ficar abaixo do próximo ponto, depois a mediana se manterá nesse ponto e novamente não mova-se à medida que continua movendo seu ponto para baixo. [Editado por comentário]
Portanto, transformações diferentes de seus pontos fazem com que a média ou a mediana pareçam menos suaves ou estáveis em algum sentido. Os especialistas em matemática aqui mostraram as distribuições das quais você pode experimentar, o que mais se aproxima do seu experimento, mas espero que essa intuição também ajude.
fonte
[1, 3, 5, 7, 9]
. Inicialmente, a mediana é5
. Essa permanecerá a mediana até o quinto ponto (inicialmente9
) cair abaixo5
, altura em que a mediana seguirá suavemente o quinto ponto à medida que diminui até atingir3
o ponto em que a mediana permanecerá3
. Portanto, mesmo que o ponto que define a mediana seja "pular" (do terceiro ponto ao quinto ponto e ao segundo ponto), o valor real da mediana não tem salto / descontinuidade.Portanto, temos:
fonte
Comentário: Apenas para repetir sua simulação, usando uma distribuição para a qual SDs de médias e medianas têm o resultado oposto:
Especificamente,
nums
agora são de uma distribuição Laplace (também chamada de 'dupla exponencial'), que pode ser simulada como a diferença de duas distribuições exponenciais com a mesma taxa (aqui a taxa padrão 1). [Talvez veja a Wikipedia sobre distribuições de Laplace.]Nota: Outra possibilidade fácil, mencionada explicitamente no link do @ whuber, é o Cauchy, que pode ser simulado como distribuição t de Student com um grau de liberdade
rt(10^6, 1)
. No entanto, suas caudas são tão pesadas que fazer um bom histograma é problemático.fonte