Esse estimador não existe.
A intuição é que a mediana pode permanecer fixa enquanto mudamos livremente a densidade de probabilidade em ambos os lados, para que qualquer estimador cujo valor médio seja a mediana de uma distribuição tenha uma média diferente para a distribuição alterada, tornando-a enviesada. A exposição a seguir dá um pouco mais de rigor a essa intuição.
Nós concentrar em distribuições tendo medianas únicas m , de modo que, por definição, F ( m ) ≥ 1 / 2 e M ( X ) < 1 / 2 para todos os x < m . Corrija um tamanho de amostra n ≥ 1 e suponha que t : [ 0 , 1 ] n → [ 0 , 1 ] calcule m . (Basta que tFmF(m)≥1/2F(x)<1/2x<mn≥1t:[0,1]n→[0,1]mtsó pode ser limitada, mas que geralmente não se considerar seriamente estimadores que produzem valores obviamente impossível) Nós fazemos. há suposições sobre ; nem precisa ser contínuo em qualquer lugar.t
O significado de ser imparcial (para esse tamanho fixo de amostra) é quet
EF[t(X1,…,Xn)]=m
para qualquer amostra iid com . Um "estimador" t é um com esta propriedade para todos tais F .Xi∼FtF
Suponha que exista um estimador imparcial. Derivaremos uma contradição aplicando-a a um conjunto particularmente simples de distribuições. Considere as distribuições com estas propriedades:F=Fx,y,m,ε
;0≤x<y≤1
;0<ε<(y−x)/4
;x+ε<m<y−ε
;Pr(X=x)=Pr(X=y)=(1−ε)/2
; ePr(m−ε≤X≤m+ε)=ε
é uniforme em [ m - ε , m + ε ] .F[m−ε,m+ε]
Essas distribuições colocam a probabilidade em cada um de x e y e uma pequena quantidade de probabilidade simetricamente colocada em torno de m entre x e y . Isso faz com que estou a mediana única de F . (Se você está preocupado com o fato de essa não ser uma distribuição contínua, envolva-a com uma gaussiana muito estreita e trunque o resultado para [ 0 , 1 ](1−ε)/2xymxymF[0,1] : o argumento não será alterado.)
Agora, para qualquer estimador mediano putativo , uma estimativa fácil mostra que E [ t ( X 1 , X 2 , … , X n ) ] está estritamente dentro de ε da média dos valores de 2 n t ( x 1 , x 2 , ... , x n ) , onde o x i variar ao longo de todas as possíveis combinações de x e y . No entanto, podemos variar mtE[t(X1,X2,…,Xn)]ε2nt(x1,x2,…,xn)xixymentre e y - ε , uma mudança de pelo menos ε (em virtude das condições 2 e 3). Assim, existe m , e daí uma distribuição correspondente F x , y , m , ε , para a qual essa expectativa não é igual à mediana, QED.x+εy−εεmFx,y,m,ε
Finding an unbiased estimator without having a parametric model would be difficult! But you could use bootstrapping, and use that to correct the empirical median to get an approximately unbiased estimator.
fonte
I believe quantile regression will give you a consistent estimator of the median. Given the modelY=α+u . And you want to estimate med(y)=med(α+u)=α+med(u) since α is a constant. All you need is the med(u)=0 which should be true so long as you have independent draws. However, as far as unbiasedness, I don't know. Medians are difficult.
fonte