fundo
Suponha que tenhamos um modelo de Mínimos Quadrados Ordinários em que tenhamos coeficientes em nosso modelo de regressão,
onde é um vetor de coeficientes, é a matriz de design definida por
Minimizamos a soma dos erros ao quadrado, definindo nossas estimativas para como
Um estimador imparcial de é
A covariância de é dada por
Questão
Como posso provar que para ,
Minhas tentativas
Eu sei que para variáveis aleatórias amostradas de , você pode mostrar que reescrevendo o LHS como e percebendo que o número é uma distribuição normal padrão e o denominador é raiz quadrada de uma distribuição qui-quadrado com df = (n-1) e dividido por (n- 1) ( ref ) E, portanto, segue uma distribuição t com df = (n-1) ( ref ).x ∼ N ( μ , σ 2 ) ˉ x - μ( ˉ x -μ
Não consegui estender essa prova à minha pergunta ...
Alguma ideia? Estou ciente dessa questão , mas eles não a provam explicitamente, apenas fornecem uma regra prática, dizendo "cada preditor custa um grau de liberdade".
Respostas:
Como sabemos que e, portanto, sabemos que para cada componente de , onde é o elemento diagonal de . Assim, sabemos que β -β~N(0,σ2(XTX)-1)k β β k-βk~N(0,σ2Skk)Skkkth(XTX
Observe a declaração do teorema da distribuição de uma forma quadrática idempotente em um vetor normal padrão (teorema B.8 em Greene):
Let denota o vetor residual de regressão e deixe que é a matriz fabricante residual (ou seja, ) . É fácil verificar se é simétrico e idempotente . M=In-X(XTX)-1XT,My= ε Mε^
Seja um estimador de . σ2
Precisamos, então, fazer uma álgebra linear. Observe estas três propriedades da álgebra linear:
Portanto,
Então
Aplicando o Teorema para a Distribuição de uma Forma Quadrática Idempotente em um Vetor Normal Padrão (declarado acima), sabemos que .V∼χ2n−p
Como você supôs que é normalmente distribuído, então é independente de e como é uma função de , então também é independente de . Assim, e são independentes um do outro.ε β^ ε^ s2 ε^ s2 β^ zk V
Então, é a razão de uma distribuição normal padrão com a raiz quadrada de uma distribuição qui-quadrado com os mesmos graus de liberdade (isto é, ), que é uma caracterização da distribuição . Portanto, a estatística tem uma distribuição com graus de liberdade.
Em seguida, ele pode ser manipulado algebricamente em uma forma mais familiar.
fonte
Theorem for the Distribution of an Idempotent Quadratic Form in a Standard Normal Vector
, não precisamos também que seja simétrico? Infelizmente, eu não tenho Greene, então não consigo ver a prova, embora tenha visto que a Wikipedia tinha a mesma forma que você . No entanto, um exemplo de contador parece ser a matriz idempotente que leva a que não é qui-quadrado, pois pode assumir valores negativos. ..