Por que as pontuações dos componentes principais não estão correlacionadas?

9

Suponha é uma matriz de dados centralizados na média. A matriz é , possui autovalores distintos e vetores próprios \ mathbf s_1 , \ mathbf s_2 ... \ mathbf s_m , ortogonais.S = cov ( A ) m × m m s 1AS=cov(A)m×mms1s ms2sm

O i ésimo componente principal (algumas pessoas os chamam de "pontuações") é o vetor zi=Asi . Em outras palavras, é uma combinação linear das colunas de A , onde os coeficientes são os componentes do i -ésimo vector próprio de S .

Não entendo por que zi e zj acabam não sendo correlacionados para todos os ij . Isso decorre do fato de que si e sj são ortogonais? Certamente não, porque posso encontrar facilmente uma matriz B e um par de vetores ortogonais x,y tal forma que Bx e By sejam correlacionados.

Ernest A
fonte
Uma resposta relacionada stats.stackexchange.com/a/110546/3277 .
Ttnphns

Respostas:

7

zizj=(Asi)(Asj)=siAAsj=(n1)siSsj=(n1)siλjsj=(n1)λjsisj=0.
ameba
fonte
11
Matemática: que linguagem linda.
Néstor
4
Isso significa que e são ortogonais. Não correlacionado significa que isso deve ser verdadeiro: . Suponho que, de alguma maneira, e, em seguida, também impliquem que eles não estão correlacionados. z j ( z i - ˉ z i ) ( Z j - ˉ z j )=0 ˉ z i = ˉ z j =0 z i z j =0zizj(ziz¯i)(zjz¯j)=0z¯i=z¯j=0zizj=0
Ernest A
2
Bom ponto, @ Ernest. As médias são realmente zero, porque os dados foram centralizados na média (por sua suposição). Então todas as projeções devem ter média zero.
Ameba 25/05
2
@ Quebra-cabeças porque , portanto . AA=(n-1)SS=cov(A)=1n1AAAA=(n1)S
Ernest A
2
@ Ernest, não pude resistir em fornecer uma resposta que não contenha texto, mas talvez deva acrescentar que a razão subjacente pela qual os PCs não são correlacionados é que sua matriz de covariância é dada por na base de autovetores e, nessa base, se torna diagonal - - esse é o ponto principal da composição do eigend. SSS
Ameba