O que é um estimador do desvio padrão do desvio padrão se a normalidade dos dados puder ser assumida?
54
O que é um estimador do desvio padrão do desvio padrão se a normalidade dos dados puder ser assumida?
Respostas:
Seja . Conforme mostrado neste tópico , o desvio padrão do desvio padrão da amostra,X1,...,Xn∼N(μ,σ2)
é
onde é a função gama , é o tamanho da amostra e é a média da amostra. Como é um estimador consistente de , isso sugere substituir por na equação acima para obter um estimador consistente de .Γ(⋅) n X¯¯¯¯=1n∑ni=1Xi s σ σ s SD(s)
Se você procura um estimador imparcial, vemos neste tópico que , que, por linearidade de expectativa, sugereE(s)=σ⋅2n−1−−−√⋅Γ(n/2)Γ(n−12)
como um estimador imparcial de . Tudo isso, juntamente com a linearidade da expectativa, fornece um estimador imparcial de : S D ( s )σ SD(s)
fonte
Suponha que você observe iid de um normal com zero médio e variação . O desvio padrão (empírico) é a raiz quadrada do estimador de (imparcial ou não, essa não é a questão). Como estimador (obtido com ), possui uma variação que pode ser calculada teoricamente. Talvez o que você chama de desvio padrão do desvio padrão seja na verdade a raiz quadrada da variação do desvio padrão, ou seja, ? Não é um estimador, é uma quantidade teórica (algo comoσ 2 σ 2 σ 2 X 1 , ... , X n σ √X1,…,Xn σ2 σ^2 σ2 X1,…,Xn σ^ σ/ √E[(σ−σ^)2]−−−−−−−−−√ σ/n−−√ para ser confirmado) que pode ser calculado explicitamente!
fonte
O @Macro forneceu uma ótima explicação matemática com a equação para calcular. Aqui está uma explicação mais geral para pessoas menos matemáticas.
Eu acho que a terminologia "SD of SD" é confusa para muitos. É mais fácil pensar no intervalo de confiança de um SD. Qual é a precisão do desvio padrão que você calcula de uma amostra? Por acaso, você pode obter dados agrupados, tornando o SD da amostra muito menor que o SD da população. Ou você pode obter valores aleatoriamente muito mais dispersos que a população em geral, tornando o SD da amostra maior que o SD da população.
A interpretação do IC do SD é simples. Comece com a suposição habitual de que seus dados foram amostrados aleatoriamente e independentemente de uma distribuição gaussiana. Agora repita essa amostragem várias vezes. Você espera que 95% desses intervalos de confiança incluam o verdadeiro DP da população.
Qual a largura do intervalo de confiança de 95% de um SD? Depende do tamanho da amostra (n), é claro.
n: IC95% de DP
2: 0,45 * DP a 31,9 * DP
3: 0,52 * SD para 6,29 * SD
5: 0,60 * SD para 2,87 * SD
10: 0,69 * SD para 1,83 * SD
25: 0,78 * SD a 1,39 * SD
50: 0,84 * SD para 1,25 * SD
100: 0,88 * SD para 1,16 * SD
500: 0,94 * SD para 1,07 * SD
Calculadora gratuita na web
fonte