Por que a distribuição amostral de variância é uma distribuição qui-quadrado?

22

A declaração

A distribuição amostral da variância amostral é uma distribuição qui-quadrado com grau de liberdade igual a , onde n é o tamanho da amostra (dado que a variável aleatória de interesse é normalmente distribuída).n1n

Fonte

Minha intuição

Faz um sentido intuitivo para mim 1) porque um teste do qui-quadrado se parece com uma soma do quadrado e 2) porque uma distribuição do qui-quadrado é apenas uma soma da distribuição normal ao quadrado. Mas, ainda assim, não tenho uma boa compreensão disso.

Questão

A afirmação é verdadeira? Por quê?

Remi.b
fonte
1
A declaração inicial é falsa em geral (é falsa por dois motivos separados). Qual é a sua fonte (o seu link está ausente) e o que realmente diz?
Glen_b -Reinstala Monica
Minha pergunta também vem à reação a uma pergunta-resposta em uma classe de estatísticas introdutórias para a qual o acesso está protegido. A pergunta é "Qual distribuição é a distribuição amostral da variação no comprimento da asa em moscas?" e a resposta é "distribuição qui-quadrado"
Remi.b 27/10/14
1
A declaração citada em seu primeiro comentário ainda é falsa em geral. O comentário no final da fonte é verdadeiro (com as premissas necessárias): " quando amostras de tamanho n são retiradas de uma distribuição normal com variação , a distribuição amostral de ( n - 1 ) s 2 / σ 2 tem uma distribuição qui-quadrado com n-1 graus de liberdade.σ2(n1)s2/σ2 "... A resposta à pergunta em seu segundo comentário também será falsa - a menos que, suponho, alguém tenha mostrado que o comprimento da asa é normalmente distribuído. (Que base poderia haver para afirmar que isso é verdade?)
Glen_b -Reinstate Monica
Então, vamos assumir que as asas estão normalmente distribuídas, então a distribuição amostral de seria distribuída em qui-quadrado. Por que é tão? (n1)s2/σ2
Remi.b
Você está ciente de que uma soma dos quadrados das variáveis ​​aleatórias iid N (0,1) é qui-quadrado com k df? Ou é essa a parte da qual você busca provas? kk
Glen_b -Reinstala Monica

Respostas:

27

[Eu vou assumir a partir da discussão em sua pergunta que você está feliz em aceitar como verdade que, se são independentes identicamente distribuídas N ( 0 , 1 ) variáveis aleatórias, então Σ k i = 1 Z 2 i ~ χ 2 k .]Zi,i=1,2,,kN(0,1)i=1kZi2χk2

Formalmente, o resultado que você precisa segue do teorema de Cochran . (Embora possa ser mostrado de outras maneiras)

Menos formalmente, considere que, se soubéssemos a média da população, e estimamos a variação sobre ela (em vez da média da amostra): , entãos 2 0 /σ2=1s02=1ni=1n(Xiμ)2 , (Zi=(Xi-μ)/σ) que será1s02/σ2=1ni=1n(Xiμσ)2=1ni=1nZi2Zi=(Xiμ)/σ vezes umavariável aleatóriaχ 2 n .1nχn2

O fato de a média da amostra ser utilizada, em vez da média da população ( ) diminui a soma dos quadrados dos desvios, mas da maneira que n i = 1 ( Z i ) 2Zi=(XiX¯)/σ (sobre o qual, ver o teorema de Cochran). Portanto, em vez de n s 2i=1n(Zi)2χn12 temos agora(n-1)s2/σ2~χ 2 n - 1 .ns02/σ2χn2(n1)s2/σ2χn12

Glen_b -Reinstate Monica
fonte
@Glen_b Você pode dar uma referência para outras provas desse fato? Eu realmente quero saber disso.
Henry.L
De quais dos vários fatos você procura após a prova?
Glen_b -Reinstate Monica
@Glen_b Os dois únicos métodos, além do teorema de Cochran-Madow, de provar esse fato de que a variação da amostra e a média da amostra são independentes do ponto de vista estatístico, com distribuição qui-quadrado, são: (1) a base canônica de Scheffe (Scheffe, 1959) (2) métodos cumulantes (Ou mgfs, que é equivalente a ele). Se você conhece mais métodos, eu realmente quero conhecê-los.
Henry.L
Mais um comentário que quero acrescentar é que, embora a média da amostra seja usada, mas às vezes queremos uma potência fixa independente da variação fixa, esse método é substituído pelo método de dois estágios de Stein (1949).
Henry.L
O que eu não entendo sobre esta resposta, é que não é independente de todos os X ' i é , então, como podemos aplicar o teorema de Cochran? diz que todos eles precisam ser independentes. X¯Xis
user56834