Equação para os fatores de inflação da variação

8

Após uma pergunta feita anteriormente, os fatores de inflação de variação (VIFs) podem ser expressos como é a versão em escala de tamanho da unidade deWX

VIFj=Var(b^j)σ2=[wjwjwjWj(WjWj)1Wjwj]1
WX

Alguém pode me mostrar como chegar daqui à equação é o coeficiente de determinação múltipla obtido pela regressão de nas outras variáveis ​​do regressor. R 2 j xj

VIFj=11Rj2
Rj2xj

Estou tendo muitos problemas para acertar essas operações de matriz ...

Comunidade
fonte

Respostas:

9

Suponha que todas as variáveis sejam padronizadas pela transformação de correlação, como você mencionou, na versão escalonada do tamanho da unidade . O modelo padronizado não altera a correlação entre variáveis pode ser calculado quando é feita a transformação padronizada do modelo linear original. Vamos denotar a matriz de design após a transformação padronizada como Então XXXVIF

X=[1X11X1,p11X21X2,p11Xn1Xn,p1].
XX=[n00rXX],
que é a matriz de correlação das variáveisTambém sabemos que para é o ésimo termo diagonal de .rXXX
σ2{β^}=σ2(XX)1=σ2[1n00rXX1.]
VIFkk=1,2,,p1krXX1k=1rXXk . Vamos definir: Observe que ambas as matrizes são diferentes das matrizes de design. Como nos preocupamos apenas com os coeficientes das variáveis , o vetor de uma matriz de design pode ser ignorado em nosso cálculo. Portanto, usando o complemento de Schur ,
X(1)=[X12X1,p1X22X2,p1Xn2Xn,p1],X1=[X11X21Xn1].
X1
rXX1(1,1)=(r11r1X(1)rX(1)X(1)1rX(1)1)1=(r11[r1X(1)rX(1)X(1)1]rX(1)X(1)[rX(1)X(1)1rX(1)1])1=(1β1X(1)X(1)X(1)β1X(1))1,
que são os coeficientes de regressão de em exceto a interceptação. De fato, a interceptação deve ser a origem, já que todos osβ1X(1)X1X2,,Xp1Xvariáveis ​​são padronizadas com média zero. Por outro lado, (seria mais fácil escrever tudo em forma de matriz explícita) Portanto,
R12=SSRSSTO=β1X(1)X(1)X(1)β1X(1)1=β1X(1)X(1)X(1)β1X(1).
VIF1=rXX1(1,1)=11R12.

jwyao
fonte