Por que o desvio padrão da amostra é um estimador enviesado de

De acordo com o artigo da Wikipedia sobre estimativa imparcial do desvio padrão, a amostra DP

s = \sqrt{\frac{1 1}{n - 1 1} \sum_{Eu = 1 1}^{n} (x_{Eu} - \bar{x})^{2}}

$s = \sqrt{\frac{1}{n-1} \sum_{i=1}^n (x_i - \overline{x})^2}$

é um estimador tendencioso do DP da população. Ele afirma que $E(\sqrt{s^2}) \neq \sqrt{E(s^2)}$ .

NB Variáveis aleatórias são independentes e cada $x_{i} \sim N(\mu,\sigma^{2})$

Minha pergunta é dupla:

Qual é a prova da parcialidade?
Como calcular a expectativa do desvio padrão da amostra

Meu conhecimento de matemática / estatística é apenas intermediário.

estimation standard-deviation Dav Weps
fonte

Você encontrará as duas perguntas respondidas no artigo da Wikipedia sobre a distribuição do Chi .

whuber

A resposta da @ NRH a esta pergunta fornece uma prova simples e agradável da parcialidade do desvio padrão da amostra. Aqui vou calcular explicitamente a expectativa do desvio padrão da amostra (a segunda pergunta do pôster original) de uma amostra normalmente distribuída, momento em que o viés é claro.

A variância da amostra imparcial de um conjunto de pontos é $x_1, ..., x_n$

s^{2} = \frac{1}{n - 1} \sum_{i = 1}^{n} (x_{i} - \bar{x})^{2}

$s^{2} = \frac{1}{n-1} \sum_{i=1}^{n} (x_i - \overline{x})^2$

Se o 's são distribuídos normalmente, é um facto que $x_i$

\frac{(n - 1) s^{2}}{σ^{2}} \sim χ_{n - 1}^{2}

$\frac{(n-1)s^2}{\sigma^2} \sim \chi^{2}_{n-1}$

onde é a verdadeira variação. A distribuição tem densidade de probabilidade $\sigma^2$ $\chi^2_{k}$

p (x) = \frac{(1 / 2)^{k / 2}}{Γ (k / 2)} x^{k / 2 - 1} e^{- x / 2}

$p(x) = \frac{(1/2)^{k/2}}{\Gamma(k/2)} x^{k/2 - 1}e^{-x/2}$

usando isso, podemos derivar o valor esperado de ; $s$

\begin{aligned} E (s) & = \sqrt{\frac{σ^{2}}{n - 1}} E (\sqrt{\frac{s^{2} (n - 1)}{σ^{2}}}) \\ = \sqrt{\frac{σ^{2}}{n - 1}} \int_{0}^{\infty} \sqrt{x} \frac{(1 / 2)^{(n - 1) / 2}}{Γ ((n - 1) / 2)} x^{((n - 1) / 2) - 1} e^{- x / 2} d x \end{aligned}

$\begin{align} E(s) &= \sqrt{\frac{\sigma^2}{n-1}} E \left( \sqrt{\frac{s^2(n-1)}{\sigma^2}} \right) \\ &= \sqrt{\frac{\sigma^2}{n-1}} \int_{0}^{\infty} \sqrt{x} \frac{(1/2)^{(n-1)/2}}{\Gamma((n-1)/2)} x^{((n-1)/2) - 1}e^{-x/2} \ dx \end{align}$

que decorre da definição do valor esperado e do fato de que é a raiz quadrada de umavariável distribuída. O truque agora é reorganizar os termos para que o integrando se torne outradensidade: $\sqrt{\frac{s^2(n-1)}{\sigma^2}}$ $\chi^2$ $\chi^2$

\begin{aligned} E (s) & = \sqrt{\frac{σ^{2}}{n - 1 1}} \int_{0 0}^{\infty} \frac{(1 1 / 2)^{(n - 1 1) / 2}}{Γ (\frac{n - 1 1}{2})} x^{(n / 2) - 1 1} e^{- x / 2} d x \\ = \sqrt{\frac{σ^{2}}{n - 1 1}} \cdot \frac{Γ (n / 2)}{Γ (\frac{n - 1 1}{2})} \int_{0 0}^{\infty} \frac{(1 1 / 2)^{(n - 1 1) / 2}}{Γ (n / 2)} x^{(n / 2) - 1 1} e^{- x / 2} d x \\ = \sqrt{\frac{σ^{2}}{n - 1 1}} \cdot \frac{Γ (n / 2)}{Γ (\frac{n - 1 1}{2})} \cdot \frac{(1 1 / 2)^{(n - 1 1) / 2}}{(1 1 / 2)^{n / 2}} \underset{χ_{n}^{2} d e n s Eu t y}{\underset{⏟}{\int_{0 0}^{\infty} \frac{(1 1 / 2)^{n / 2}}{Γ (n / 2)} x^{(n / 2) - 1 1} e^{- x / 2} d x}} \end{aligned}

$\begin{align} E(s) &= \sqrt{\frac{\sigma^2}{n-1}} \int_{0}^{\infty} \frac{(1/2)^{(n-1)/2}}{\Gamma(\frac{n-1}{2})} x^{(n/2) - 1}e^{-x/2} \ dx \\ &= \sqrt{\frac{\sigma^2}{n-1}} \cdot \frac{ \Gamma(n/2) }{ \Gamma( \frac{n-1}{2} ) } \int_{0}^{\infty} \frac{(1/2)^{(n-1)/2}}{\Gamma(n/2)} x^{(n/2) - 1}e^{-x/2} \ dx \\ &= \sqrt{\frac{\sigma^2}{n-1}} \cdot \frac{ \Gamma(n/2) }{ \Gamma( \frac{n-1}{2} ) } \cdot \frac{ (1/2)^{(n-1)/2} }{ (1/2)^{n/2} } \underbrace{ \int_{0}^{\infty} \frac{(1/2)^{n/2}}{\Gamma(n/2)} x^{(n/2) - 1}e^{-x/2} \ dx}_{\chi^2_n \ {\rm density} } \end{align}$

agora conhecemos o integrando que a última linha é igual a 1, pois é uma densidade . Simplificar um pouco as constantes fornece $\chi^2_{n}$

E (s) = σ \cdot \sqrt{\frac{2}{n - 1 1}} \cdot \frac{Γ (n / 2)}{Γ (\frac{n - 1 1}{2})}

$E(s) = \sigma \cdot \sqrt{ \frac{2}{n-1} } \cdot \frac{ \Gamma(n/2) }{ \Gamma( \frac{n-1}{2} ) }$

Portanto, o viés de é $s$

σ - E (s) = σ (1 1 - \sqrt{\frac{2}{n - 1 1}} \cdot \frac{Γ (n / 2)}{Γ (\frac{n - 1 1}{2})}) \sim \frac{σ}{4 n}

$\sigma - E(s) = \sigma \bigg(1 - \sqrt{ \frac{2}{n-1} } \cdot \frac{ \Gamma(n/2) }{ \Gamma( \frac{n-1}{2} ) } \bigg) \sim \frac{\sigma}{4 n} \>$ como

n \to \infty

$n \to \infty$

Não é difícil ver que esse viés não é 0 para qualquer finito , provando assim que o desvio padrão da amostra é tendencioso. Abaixo da polarização é trama como uma função de para em vermelho, juntamente com em azul: $n$ $n$ $\sigma=1$ $1/4n$

insira a descrição da imagem aqui

Macro
fonte

(4 n)^{- 1}

$(4n)^{-1}$

Você realmente se esforçou muito para fazer essa macro. Quando vi o post pela primeira vez, cerca de um minuto atrás, eu estava pensando em mostrar o viés usando a regra de Jensen, mas alguém já o fez.

Michael Chernick 8/12/12

é claro que essa é uma maneira completa de mostrar que o desvio padrão é tendencioso - eu estava respondendo principalmente à segunda pergunta do pôster original: "Como alguém calcula a expectativa do desvio padrão?".

Macro

s

$s$

σ^{k}

$\sigma^k$

s^{k}

$s^k$

k

$k$

Por que o desvio padrão da amostra é um estimador enviesado de

Respostas: