O CCA entre dois conjuntos de dados idênticos é equivalente ao PCA nesse conjunto de dados?

9

Lendo a Wikipedia sobre análise de correlação canônica (CCA) para dois vetores aleatórios e Y , eu queria saber se a análise principal de componentes (PCA) é a mesma que CCA quando X = Y ?XYX=Y

Tim
fonte
Por favor, deixe mais claro: 1) São vectors X and Yduas variáveis ​​(colunas de dados) ou dois casos (linhas); dado que vamos realizar as análises de variáveis. 2) X and Y are the sameVocê quer dizer que X = Y ou qualquer outro caminho?
ttnphns
@ttnphns: 1) e Y são dois vetores aleatórios. São dois vetores de variáveis ​​aleatórias, dois conjuntos de colunas de dados, não dois casos (linhas). 2) X = Y . XYX=Y
Tim
Se cada conjunto consiste em uma única variável, há uma correlação canônica que é exatamente o Pearson r entre eles; e CCA torna-se regressão linear de X por Y e vice-versa. A decomposição desse r por meio do PCA é um pouco mais uma história. PCA e CCA são análises diferentes.
ttnphns
Olá, Tim, estou me perguntando se minha resposta foi útil ou se você ainda tem mais alguma dúvida. Se assim for, eu ficaria feliz em esclarecer.
Ameba
@amoeba: Sim, é. Não tenho mais perguntas no momento e lerei sua resposta mais tarde. Obrigado pela sua resposta. + 1
Tim

Respostas:

6

Xn×p1Yn×p2nXY

p1Xp2Y

X=Yp1=p2=p11pp-dimensional) e qualquer um deles produzirá uma solução CCA válida. Uma dessas maneiras é de fato dada pelo PCA, pois dois PCs têm correlação zero.

Portanto, a solução PCA será realmente uma solução CCA válida, mas há um número infinito de soluções CCA equivalentemente boas nesse caso.


abCXX1/2CXYCYY1/2Ia=bCXX1/2aCYY1/2bCXX1/2

ameba
fonte