Para quais distribuições existe um estimador imparcial de forma fechada para o desvio padrão?

16

Para a distribuição normal, existe um estimador imparcial do desvio padrão dado por:

σ^unbiased=Γ(n12)Γ(n2)12k=1n(xix¯)2

A razão pela qual esse resultado não é tão conhecido parece ser que ele é em grande parte um objeto antigo e não uma questão de grande importância . A prova é abordada neste tópico ; tira proveito de uma propriedade chave da distribuição normal:

1σ2k=1n(xix¯)2χn12

A partir daí, com um pouco de trabalho, é possível assumir a expectativa e identificando esta resposta como um múltiplo de , podemos deduzir o resultado para .E(k=1n(xix¯)2)σσ^unbiased

Isso me deixa curioso que outras distribuições têm um estimador imparcial de forma fechada do desvio padrão. Diferentemente do estimador imparcial da variância, isso é claramente específico da distribuição. Além disso, não seria fácil adaptar a prova para encontrar estimadores para outras distribuições.

As distribuições skew-normal têm algumas boas propriedades distributivas para suas formas quadráticas, das quais a propriedade de distribuição normal que usamos é efetivamente um caso especial (já que o normal é um tipo especial de skew normal), portanto, talvez não seja tão difícil assim. estenda esse método para eles. Mas, para outras distribuições, parece que é necessária uma abordagem totalmente diferente.

Existem outras distribuições pelas quais esses estimadores são conhecidos?

Silverfish
fonte
1
Se você ignorar as distrações técnicas, a natureza da resposta fica mais clara. No caso Normal, pouco do que você escreve é ​​realmente relevante para a conclusão; o que importa é que a quantidade de viés nesse estimador específico é função de sozinho (e não depende de outros parâmetros distributivos que precisam ser estimados a partir dos dados). n
whuber
@whuber Eu acho que posso ver a idéia geral que você está sugerindo, e claramente "função de sozinho" é necessária. Mas acho que não seria suficiente - se não tivéssemos acesso a bons resultados distributivos, não vejo como o aspecto de "forma fechada" seria tratável. n
Silverfish
5
Depende do que você quer dizer com "forma fechada". Por exemplo, para uma pessoa uma função teta pode ser "fechada", mas para outra é apenas um produto infinito, uma série de potências ou uma integral complexa. Venha para pensar sobre isso, é precisamente o que é uma função Gamma :-).
whuber
@whuber Bom ponto! Por "a quantidade de viés neste estimador em particular", entendo que o viés em (em vez do estimador listado na pergunta, que tem viés zero) é uma função de (e também em , mas felizmente, de maneira que possamos reorganizar facilmente para encontrar um estimador imparcial)? snσ
Silverfish
1
@ whuber: Deve haver uma fórmula semelhante para qualquer família em escala de local, com a ressalva que você apontou que a função de pode ser uma integral intratável. n
Xian

Respostas:

10

Embora isso não esteja diretamente conectado à questão, existe um artigo de 1968 de Peter Bickel e Erich Lehmann que afirma que, para uma família convexa de distribuições , existe um estimador imparcial de um q funcional ( F ) (para um tamanho de amostra n grande o suficiente) se e somente se q ( α F + ( 1 - α ) G ) for um polinômio em 0 α 1Fq(F)nq(αF+(1α)G)0α1. Este teorema não se aplica ao problema aqui porque a coleção de distribuições gaussianas não é convexa (uma mistura de gaussianos não é gaussiana).

Uma extensão do resultado da pergunta é que qualquer potência do desvio padrão pode ser estimada de maneira imparcial, desde que haja observações suficientes quando α < 0 . Isto segue do resultado 1σαα<0 queσé o parâmetro de escala (e único) para n k = 1 (xi- ˉ x )2.

1σ2k=1n(xix¯)2χn12
σk=1n(xix¯)2

Esta configuração normal pode então ser estendida a qualquer família localização escala com uma variação finita σ 2 . De fato,

X1,,Xniidτ1f(τ1{xμ})
σ2
  1. a variância é apenas uma função de τ ;
    varμ,τ(X)=Eμ,τ[(Xμ)2]=τ2E0,1[X2]
    τ
  2. a soma dos quadrados tem uma expectativa da formaτ2ψ(n);
    Eμ,τ[k=1n(XiX¯)2]=τ2Eμ,τ[k=1nτ2(XiμX¯+μ)2]=τ2E0,1[k=1n(XiX¯)2]
    τ2ψ(n)
  3. e similarmente para qualquer potência tal que a expectativa seja finita.
    Eμ,τ[{k=1n(XiX¯)2}α]=τ2αE0,1[{k=1n(XiX¯)2}α]
Xi'an
fonte
10

Um caso provavelmente bem conhecido, mas, mesmo assim.
Considere uma distribuição uniforme contínua . Dada uma amostra de iid, a estatística de pedido máximo, X ( n ) tem valor esperadoU(0,θ)X(n)

E(X(n))=nn+1θ

O desvio padrão da distribuição é

σ=θ23

Assim, o estimador de σ = 1

σ^=123n+1nX(n)

é evidentemente imparcial para . σ

Isso generaliza para o caso em que o limite inferior da distribuição também é desconhecido, pois podemos ter um estimador imparcial para o Range e, em seguida, o desvio padrão é novamente uma função linear do Range (como também é essencialmente acima também).

Isso exemplifica o comentário de @ whuber, de que "a quantidade de viés é uma função de sozinha" (mais possivelmente de todas as constantes conhecidas) - para que possa ser corrigida de forma determinística . E este é o caso aqui.n

Alecos Papadopoulos
fonte
4
Agora a parte mais difícil: quando no mundo estamos interessados ​​no desvio padrão de uma distribuição uniforme? (+1)
shadowtalker
1
@ssdecontrol Essa é uma excelente pergunta! -Por favor, prossiga para a próxima ...
Alecos Papadopoulos
2
Uma coisa que eu amo nessa resposta é o quão pobre o estimador é. É bastante comum ver uma pergunta que se resume a "por que usar θ como um estimador mesmo que ele é tendencioso?" Alguns estudantes precisam convencer que a imparcialidade não é o princípio e o fim, e um estimador imparcial ruim é uma maneira de mostrar a eles. θ^
Silverfish
1
@ Silverfish Pobre de que maneira? Algumas simulações rápidas mostram que esse MSE é menor do que o desvio padrão usual (o que me surpreendeu).
Dave Dave
@Dave Interesting! Eu tinha chegado à conclusão de que seria ruim, uma vez que apenas olhava para a estatística de pedidos máximos, mas também fico surpresa! Mostra o valor de fazer algumas simulações ...
Silverfish