Por que a inclinação sempre é exatamente 1 ao regredir os erros nos resíduos usando o OLS?

10

Eu estava experimentando a relação entre os erros e os resíduos usando algumas simulações simples em R. Uma coisa que eu descobri é que, independentemente do tamanho da amostra ou variação de erro, sempre consigo exatamente 1 1 para a inclinação quando você se encaixa no modelo

errorsβ0 0+β1 1×resEudvocêumaeus

Aqui está a simulação que eu estava fazendo:

n <- 10 
s <- 2.7 

x <- rnorm(n) 
e <- rnorm(n,sd=s)
y <- 0.3 + 1.2*x + e

model <- lm(y ~ x) 
r <- model$res 

summary( lm(e ~ r) )

ee rsão altamente (mas não perfeitamente) correlacionados, mesmo para amostras pequenas, mas não consigo descobrir por que isso acontece automaticamente. Uma explicação matemática ou geométrica seria apreciada.

GoF_Logistic
fonte
5
No triângulo plano OXY, com base OX, as altitudes dos lados YO e XY são a altitude do próprio triângulo. No fim, essas altitudes são dadas pelos coeficientes de lm(y~r), lm(e~r)e lm(r~r)que, portanto, devem ser todos iguais. O último, obviamente, é . Experimente todos os três desses comandos para ver. Para que o último funcione, é necessário criar uma cópia , como . Para obter mais informações sobre diagramas geométricos de regressão, consulte stats.stackexchange.com/a/113207 . 1 1Rrs<-r;lm(r~s)
whuber
11
Obrigado @whuber. Gostaria de fazer uma resposta para que eu possa aceitá-la ou talvez marque isso como uma duplicata?
GoF_Logistic 06/06
11
Não acho que seja uma duplicata, então expandi o comentário para uma resposta.
whuber

Respostas:

11

a resposta do whuber é ótima! (+1) Eu resolvi o problema usando a notação mais familiar para mim e calculei que a derivação (menos interessante, mais rotineira) pode valer a pena incluir aqui.

Vamos ser o modelo de regressão, para X R n × p e £ o ruído. Em seguida, a regressão de y contra as colunas de X tem as equações normais X T ( y - X β ) = 0 , produzindo estimativas β = ( X T X ) - 1 X T Portanto a regressão possui residuais ry=Xβ+ϵXRn×pϵyXXT(y-Xβ^)=0 0,

β^=(XTX)-1 1XTy.
para H = X ( X T X ) - 1 X
r=y-Xβ^=(Eu-H)y=(Eu-H)ϵ,
.H=X(XTX)-1 1XT

Regressar em r resulta em uma inclinação estimada dada por ( r T r ) - 1 rϵr desdeque-Hé simétrico e idempotente e£im(X)quase certamente.

(rTr)-1 1rTϵ=([(Eu-H)ϵ]T[(Eu-H)ϵ])-1 1[(Eu-H)ϵ]Tϵ=ϵT(Eu-H)TϵϵT(Eu-H)T(Eu-H)ϵ=ϵT(Eu-H)ϵϵT(Eu-H)ϵ=1 1,
Eu-HϵEum(X)

Além disso, esse argumento também se aplica se incluirmos uma interceptação quando realizamos a regressão dos erros nos resíduos se uma interceptação foi incluída na regressão original, uma vez que as covariáveis ​​são ortogonais (ou seja, , das equações normais) .1 1Tr=0 0

user795305
fonte
+1 É sempre bom ver uma solução elaborada com cuidado e clareza.
whuber
11

xeY=βx+ebβr=Y-bxO

Figura

βxeYbxY-bxr

xOY(βx)YrrYrYererrr1 1


re=r+(β-b)xY=e+βx=r+(2β-b)xxxrr1 1xr

whuber
fonte