Depois de executar o PCA, o primeiro componente descreve a maior parte da variabilidade. Isso é importante, por exemplo, no estudo de medidas corporais, onde é comumente conhecido (Jolliffe, 2002) que o eixo PC1 captura a variação de tamanho. Minha pergunta é se as pontuações do PCA após a rotação do varimax mantêm as mesmas propriedades ou são diferentes conforme mencionado neste tópico ?
Como eu preciso de pontuações PCA para análises estatísticas adicionais, estou me perguntando se o varimax é necessário e, de fato, isso atrapalha a representação da variabilidade real da amostra, para que as pontuações individuais nos eixos rotados não sejam informativas ou levem a interpretações errôneas da realidade?
Alguém também poderia sugerir algumas outras referências sobre esse tópico?
Fluxos de trabalho em R:
- PCA (
FactoMineR
ouprcomp
) -> Extrair pontuações individuais -> Digite pontuações nolm
- PCA (
FactoMiner
ouprcomp
) -> Varimax na matriz de cargas -> calcular as pontuações individuais -> inserir pontuações nalm
- FA (
psych
, método de extração varimax e pca) -> extrair pontuações individuais -> Digite pontuações nolm
Agora, sem porcentagens de rotação (1.) da variabilidade explicada são 29,32, 5,6, 3,2, nos três primeiros eixos. 2. e 3. as soluções produzem porcentagens semelhantes nos três primeiros fatores, isto é, 12.2, 12.1, 8.2. Fora do curso 1. a solução tende a empurrar todas as cargas variáveis altas no primeiro eixo, enquanto 2. e 3. tendem a distribuir as cargas entre os eixos (que é o motivo da rotação). Eu queria saber se esses três fluxos de trabalho são essenciais da mesma forma, pois as pontuações individuais são diferentes nos eixos rotacionados e não rotacionados?
fonte
Respostas:
Componentes principais padronizados (para variação de unidade) após uma rotação ortogonal, como o varimax, são simplesmente componentes principais padronizados rotacionados (por "componente principal", quero dizer escores de PC). Na regressão linear, a escala de preditores individuais não tem efeito e a substituição de preditores por suas combinações lineares (por exemplo, através de uma rotação) também não tem efeito. Isso significa que, usando uma das seguintes opções em uma regressão:
A variação total capturada pelos PCs brutos e rotacionados é a mesma.
Isso responde à sua pergunta principal. No entanto, você deve ter cuidado com seus fluxos de trabalho, pois é muito fácil ficar confuso e atrapalhar os cálculos. A maneira mais simples de obter pontuações padronizadas de PCs rotacionadas é usar a
psych::principal
função:Seu fluxo de trabalho nº 2 pode ser mais complicado do que você imagina, porque os carregamentos após a rotação do varimax não são ortogonais; portanto, para obter as pontuações, você não pode simplesmente projetar os dados nas cargas giradas. Veja minha resposta aqui para obter detalhes:
Seu fluxo de trabalho nº 3 provavelmente também está errado, pelo menos se você se referir à
psych::fa
função. Não faz PCA; ofm="pa"
método de extração refere-se ao método de "fator principal", baseado no PCA, mas não é idêntico ao PCA (é um método iterativo). Como escrevi acima, você precisapsych::principal
executar o PCA.Veja minha resposta no seguinte tópico para obter uma conta detalhada sobre PCA e varimax:
fonte