Prova fácil de ?

10

Seja sejam variáveis ​​aleatórias normais padrão independentes. Existem muitas (longas) provas por aí, mostrando queZ1,,Zn

i=1n(Zi1nj=1nZj)2χn12

Muitas provas são bastante longas e algumas delas usam indução (por exemplo, Casella Statistical Inference). Gostaria de saber se existe alguma prova fácil desse resultado.

3x89g2
fonte
Para uma abordagem geométrica intuitiva (sem coordenadas), consulte a Seção 1.2 do excelente texto A abordagem sem coordenadas para modelos lineares, por Michael J. Wichura (os detalhes técnicos são preenchidos no Teorema 8.2), onde o autor realmente comparou o tradicional prova de matriz (fornecida pela resposta de whuber) e sua abordagem de projeção, mostrando que sua abordagem geométrica é mais natural e menos obscura. Pessoalmente, acho que essa prova é perspicaz e sucinta.
Zhanxiong

Respostas:

10

Para , definak=1,2,,n1

Xk=(Z1+Z2++ZkkZk+1)/k+k2.

O , sendo transformações lineares de variáveis ​​aleatórias multinormalmente distribuídas , também possui uma distribuição multinormal. Observe queZ iXkZi

  1. A matriz de variância-covariância de é a matriz de identidade .n - 1 × n - 1(X1,X2,,Xn1)n1×n1

  2. X12+X22++Xn12=i=1n(ZiZ¯)2.

( 2 ) X k ˉ Z . 1 + 1 + + 1 - k = 0 k(1) , que é fácil de verificar, implica diretamente ao observar que todos os não estão correlacionados com Todos os se ao fato de que , onde existem .(2)XkZ¯.1+1++1k=0k

Juntos, eles mostram que tem a distribuição da soma de variáveis ​​normais não-correlacionadas da variação de unidade. Por definição, esta é a , QED .n-1χ2(n-1)i=1n(ZiZ¯)2n1χ2(n1)

Referências

  1. Para uma explicação de onde vem a construção de , consulte o início da minha resposta em Como executar a transformação isométrica da razão logarítmica relativa às matrizes de Helmert .Xk

  2. Esta é uma simplificação da demonstração geral dada na resposta do ocram em Por que o RSS é distribuído chi square times np . Essa resposta afirma "existe uma matriz" para construir o ; aqui, eu exibo essa matriz.Xk

whuber
fonte
Esta construção tem uma interpretação geométrica simples. (1) As variáveis são distribuídas em uma distribuição esférica simétrica n-dimensional (portanto, podemos rotacioná-la da maneira que ). (2) O é encontrado como uma solução para o problema linear , que é efetivamente uma projeção do vetor em . (3) Se girarmos o espaço de coordenadas de modo que uma das coordenadas coincida com esse vetor de projeção, , o restante será uma distribuição (n-1) -multinomial que representa o espaço residual. ¯ Z Z iZiZ¯Z 1 1Zi=Z¯+ϵiZ11
Sextus Empiricus
Você mostra que os não estão correlacionados. Mas, tanto quanto eu entendo, para dizer que uma soma das variáveis ​​normais padrão ao quadrado é , precisamos de independência, que é um requisito muito mais forte do que não correlacionado? EDIT: oh espera, se sabemos que duas variáveis ​​são normalmente distribuídas, então não correlacionadas implica independência. χ 2Xiχ2
user56834
Além disso, não entendo como você vai do fato de que os não estão correlacionados com (o que eu entendo) para (2). Você poderia elaborar? XiZ¯
user56834
@ Programador Desculpe; Eu não quis dizer que é uma dedução lógica - (1) e (2) são duas observações separadas. (2) é apenas uma identidade algébrica (direta).
whuber
11
Programador, observe o link para a outra resposta que Whuber deu ( stats.stackexchange.com/questions/259208/… ) Os são construídos com base em uma matriz, , com linhas ortogonais. Portanto, você pode avaliar de uma maneira mais abstrata (menos falível) como , (note que temos que estender K pelo vetor 1111 para torná-lo n por n) # H K 2 i K K = ( H Z ) ( H Z ) = ( H Z ) T ( H Z ) = Z T ( H T H ) Z = ZXkHKi2KK=(HZ)(HZ)=(HZ)T(HZ)=ZT(HTH)Z=ZTIZ=ZZ
Sextus Empiricus
5

Observe que você diz que são iid com normal padrão , com eN ( 0 , 1 ) μ = 0 σ = 1ZisN(0,1)μ=0σ=1

EntãoZi2χ(1)2

Então

i=1nZi2=i=1n(ZiZ¯+Z¯)2=i=1n(ZiZ¯)2+nZ¯2(1)=i=1n(ZiZ¯)2+[n(Z¯0)1]2

Observe que o lado esquerdo de (1), e que o segundo termo no lado direito [

i=1nZi2χ(n)2
[n(Z¯0)1]2χ(1)2.

Além disso, modo que e sejam independentes. Portanto, os dois últimos termos em (1) (funções de e ) também são independentes. Portanto, seus mgfs estão relacionados ao mgf do lado esquerdo de (1) através de que e . O mgf de é, portanto, . Assim, é qui-quadrado com graus de liberdade.Z i - ˉ Z ˉ Z Z i - ˉ Z Z i M n ( t ) = M n - 1 ( t ) M 1 ( t ) M n ( t ) = ( 1 - 2 t ) - n / 2Cov(ZiZ¯,Z¯)=0ZiZ¯Z¯ZiZ¯Zi

Mn(t)=Mn1(t)M1(t)
Mn(t)=(12t)n/2 Σ n i = 1M1(t)=(12t)1/2M n - 1 ( ti=1n(ZiZ¯)2 n i = 1 (Zi- ˉ Z )2n-1Mn1(t)=Mn(t)/M1(t)=(12t)(n1)/2i=1n(ZiZ¯)2n1
Norte profundo
fonte
11
A última "Por isso" é muito descuidado
Zhanxiong
O independente que pode ser visto da privação padrão depende deX¯
Deep North
2
"desvio padrão independente de "? Talvez o que você queira dizer seja seja independente de . Infelizmente, isto não é verdade. O que realmente vale é é independente de , que também faz parte da prova que precisamos concluir (em vez de usá-lo ao mostrar essa proposição). ΣZ 2 i ˉ Z Σ(Zi- ˉ Z )2 ˉ ZX¯Zi2Z¯(ZiZ¯)2Z¯
Zhanxiong
Eu acho que eu usei Teorema de Cochran
Profundo do Norte
3
@DeepNorth Se preencheu alguns peças que faltam em sua prova
Jarle Tufto