Eu sei que a distribuição da variação de amostra
É do fato de que pode ser expressa na forma de matriz,
(onde A: simétrico), e pode ser novamente expressa em: (onde Q: ortonormal, D: matriz diagonal).
Que tal , dada a suposição ?
Eu acho que
Mas não tenho idéia de como provar ou mostrar.
É distribuído exatamente como ?
Respostas:
Podemos provar isso para um caso mais geral dep variáveis usando a "matriz de chapéu" e algumas de suas propriedades úteis. Esses resultados são geralmente muito mais difíceis de declarar em termos não matriciais, devido ao uso da decomposição espectral.
Agora, na versão matricial dos mínimos quadrados, a matriz do chapéu éH=X(XTX)−1XT Onde X tem n linhas e p+1 colunas (coluna de unidades para β0 ) Assuma a classificação completa da coluna por conveniência - caso contrário, você pode substituirp+1 pela classificação da coluna de X na sequência. Podemos escrever os valores ajustados comoY^i=∑nj=1HijYj ou em notação matricial Y^=HY . Usando isso, podemos escrever a soma dos quadrados como:
OndeIn é uma matriz de identidade de ordem n . The last step follows from the fact that H is an idepotent matrix, as
Now a neat property of idepotent matrices is that all of their eigenvalues must be equal to zero or one. Lettinge denote a normalised eigenvector of H with eigenvalue l , we can prove this as follows:
(note thate cannot be zero as it must satisfy eTe=1 ) Now because H is idepotent, In−H also is, because
We also have the property that the sum of the eigenvalues equals the trace of the matrix, and
HenceI−H must have n−p−1 eigenvalues equal to 1 and p+1 eigenvalues equal to 0 .
Now we can use the spectral decomposition ofI−H=ADAT where D=(In−p−10[p+1]×[n−p−1]0[n−p−1]×[p+1]0[p+1]×[p+1]) and A is orthogonal (because I−H is symmetric) . A further property which is useful is that HX=X . This helps narrow down the A matrix
and we get:
Now, under the model we haveY∼N(Xβ,σ2I) and using standard normal theory we have ATY∼N(ATXβ,σ2ATA)∼N(ATXβ,σ2I) showing that the components of ATY are independent. Now using the useful result, we have that (ATY)i∼N(0,σ2) for i=1,…,n−p−1 . The chi-square distribution with n−p−1 degrees of freedom for the sum of squared errors follows immediately.
fonte