Em um artigo que escrevi, modelo as variáveis aleatórias e vez de e para remover efetivamente os problemas que surgem quando e são altamente correlacionados e têm variância igual (como no meu aplicativo). Os árbitros querem que eu dê uma referência. Eu poderia provar isso facilmente, mas, sendo um diário de aplicativos, eles preferem uma referência a uma simples derivação matemática.X - Y X Y X Y
Alguém tem alguma sugestão para uma referência adequada? Pensei que havia algo no livro da EDA de Tukey (1977) sobre somas e diferenças, mas não consigo encontrá-lo.
correlation
multicollinearity
Rob Hyndman
fonte
fonte
Respostas:
Eu me referiria à análise de regressão linear de Seber GAF (1977). Wiley, Nova Iorque. Teorema 1.4.
Isto diz .cov(AX,BY)=Acov(X,Y)B′
Tome = (1 1) e = (1 -1) e = = vetor com seus X e Y.A B X Y
Observe que, para ter , é fundamental que X e Y tenham variações semelhantes. Se , será grande.var ( X ) ≫ var ( Y ) cov ( X + Y , X - Y )cov(X+Y,X−Y)≈0 var(X)≫var(Y) cov(X+Y,X−Y)
fonte