A declaração
A distribuição amostral da variância amostral é uma distribuição qui-quadrado com grau de liberdade igual a , onde n é o tamanho da amostra (dado que a variável aleatória de interesse é normalmente distribuída).
Minha intuição
Faz um sentido intuitivo para mim 1) porque um teste do qui-quadrado se parece com uma soma do quadrado e 2) porque uma distribuição do qui-quadrado é apenas uma soma da distribuição normal ao quadrado. Mas, ainda assim, não tenho uma boa compreensão disso.
Questão
A afirmação é verdadeira? Por quê?
Respostas:
[Eu vou assumir a partir da discussão em sua pergunta que você está feliz em aceitar como verdade que, se são independentes identicamente distribuídas N ( 0 , 1 ) variáveis aleatórias, então Σ k i = 1 Z 2 i ~ χ 2 k .]Zi,i=1,2,…,k N(0,1) ∑ki=1Z2i∼χ2k
Formalmente, o resultado que você precisa segue do teorema de Cochran . (Embora possa ser mostrado de outras maneiras)
Menos formalmente, considere que, se soubéssemos a média da população, e estimamos a variação sobre ela (em vez da média da amostra): , entãos 2 0 /σ2=1s20=1n∑ni=1(Xi−μ)2 , (Zi=(Xi-μ)/σ) que será1s20/σ2=1n∑ni=1(Xi−μσ)2=1n∑ni=1Z2i Zi=(Xi−μ)/σ vezes umavariável aleatóriaχ 2 n .1n χ2n
O fato de a média da amostra ser utilizada, em vez da média da população ( ) diminui a soma dos quadrados dos desvios, mas da maneira que ∑ n i = 1 ( Z ∗ i ) 2Z∗i=(Xi−X¯)/σ (sobre o qual, ver o teorema de Cochran). Portanto, em vez de n s 2∑ni=1(Z∗i)2∼χ2n−1 temos agora(n-1)s2/σ2~χ 2 n - 1 .ns20/σ2∼χ2n (n−1)s2/σ2∼χ2n−1
fonte