Intervalo de confiança para a mediana

8

Eu tenho um conjunto de valores dos quais eu calculo a mediana M. Eu queria saber como eu poderia calcular o erro nessa estimativa.xEu,Eu=1,,N

Na net, descobri que pode ser calculado como ondeσé o desvio padrão. Mas não encontrei referências sobre isso. Então eu não entendo o porquê .. Alguém poderia me explicar?1,2533σNσ

Eu estava pensando que eu poderia usar o bootstrap para ter uma estimativa do erro, mas gostaria de evitá-lo porque isso atrasaria muito a minha análise.

Também estava pensando em calcular o erro na mediana dessa maneira

δM=Eu(xEu-M)2N-1

Isso faz sentido?

shamalaia
fonte
1
Você sabe com absoluta certeza que os dados são normalmente distribuídos?
gung - Restabelece Monica
são lognormal
shamalaia 15/02
4
O Bootstrap deve funcionar e não pode demorar muito. Ou você tem um conjunto de dados completo o suficiente e não precisa fazer um bootstrap, basta considerar a mediana da sua variável como uma boa estimativa da mediana real. Ou você tem um conjunto de dados bastante pequeno e pode usar o bootstrap para estimar uma mediana com seu erro de margem em pouco tempo.
YCR 15/02
2
Informações completas sobre a distribuição da mediana aparecem na minha postagem em stats.stackexchange.com/a/86804/919 . Desenvolve a teoria necessária para os intervalos de confiança não paramétricos e de aproximação normal.
whuber

Respostas:

12

Para lidar diretamente com o erro na mediana, você pode usar o intervalo de confiança não paramétrico exato para a mediana, que usa estatísticas de pedidos. Se você quiser algo diferente, isto é, uma medida de dispersão, considere a diferença média de Gini. O código está aqui para o intervalo de confiança da mediana.

Frank Harrell
fonte
Sn=cmedj(medj|xEu-xj|)
1
A mediana deve ter um erro assimétrico se a distribuição de dados for assimétrica.
25716 Frank Harrell
11

Conforme apontado na outra resposta, existe um IC não paramétrico para a mediana usando as estatísticas da ordem. Esse IC é melhor em muitos aspectos do que o que você encontrou na rede.

1.2533σNθ~θ

n(θ~-θ)euN(0 0,14[f(θ)]2)

f[f(θ)]2θσ2f

[f(θ)]2=12πσ2

e assim a variação assintótica se torna

2π4σ2

N1,2533σN

JohnK
fonte
agora na Wikipedia: en.wikipedia.org/wiki/Median#Sampling_distribution
Felipe G. Nievinski