Como calcular o intervalo de previsão para uma regressão múltipla OLS?

24

Qual é a notação algébrica para calcular o intervalo de previsão para regressão múltipla?

Parece bobagem, mas estou tendo problemas para encontrar uma notação algébrica clara disso.

Michael
fonte

Respostas:

31

Faça um modelo de regressão com N observações e k regressores:

y=Xβ+u

Dado um vetor x0 , o valor previsto para essa observação seria

E[y|x0]=y^0=x0β^.
Um estimador consistente da variação dessa previsão é
V^p=s2x0(XX)1x0,
que
s2=Σi=1Nu^i2Nk.
O erro de previsão para um y0 específico é
e^=y0y^0=x0β+u0y^0.
A covariância zero entre u0 e β^ implica que
Var[e^]=Var[y^0]+Var[u0],
e um estimador consistente disso é
V^f=s2x0(XX)1x0+s2.

O intervalo de confiança 1α confidence será:

y0±t1α/2V^p.
O intervalo de previsão 1α prediction será maior:
y0±t1α/2V^f.

Dimitriy V. Masterov
fonte
A resposta acima é muito bem feita, mas acho que essa fonte ajuda a fornecer algum contexto para a pergunta.
June Skeeter
@ Dimitriy Eu acredito que seu segundo eqn deve ter uma cenoura / chapéu, '^', sobre o . β
Don Slowik
O erro de previsão não é o residual: ? e^=u^
Don Slowik