Alguém pode me ajudar na interpretação das pontuações do PCA? Meus dados vêm de um questionário sobre atitudes em relação aos ursos. De acordo com os carregamentos, interpretei um dos meus principais componentes como "medo de ursos". As pontuações desse componente principal estariam relacionadas à forma como cada respondente mede até aquele componente principal (se ele / ela pontua positiva / negativamente)?
16
Respostas:
Basicamente, as pontuações dos fatores são calculadas como as respostas brutas ponderadas pelas cargas de fatores. Portanto, é necessário examinar as cargas fatoriais de sua primeira dimensão para ver como cada variável se relaciona com o componente principal. Observar altas cargas positivas (resp. Negativas) associadas a variáveis específicas significa que essas variáveis contribuem positivamente (resp. Negativamente) para esse componente; portanto, as pessoas que pontuam alto nessas variáveis tendem a ter pontuações mais altas (respectivamente inferiores) nessa dimensão específica.
Desenhar o círculo de correlação é útil para ter uma idéia geral das variáveis que contribuem "positivamente" vs. "negativamente" (se houver) para o primeiro eixo principal, mas se você estiver usando R, poderá ver o pacote FactoMineR e a
dimdesc()
funçãoAqui está um exemplo com os
USArrests
dados:Como pode ser visto no resultado mais recente, a primeira dimensão reflete principalmente atos violentos (de qualquer tipo). Se olharmos para o mapa individual, fica claro que os estados localizados à direita são aqueles onde esses atos são mais frequentes.
Você também pode estar interessado nesta pergunta relacionada: Quais são as pontuações dos componentes principais?
fonte
Para mim, as pontuações do PCA são apenas rearranjos dos dados de uma forma que me permite explicar o conjunto de dados com menos variáveis. As pontuações representam o quanto cada item se relaciona com o componente. Você pode nomeá-los de acordo com a análise fatorial, mas é importante lembrar que não são variáveis latentes, pois o PCA analisa toda a variação no conjunto de dados, não apenas os elementos mantidos em comum (como a análise fatorial).
fonte
Os resultados do PCA (as diferentes dimensões ou componentes) geralmente não podem ser traduzidos em um conceito real. Acho errado assumir que um dos componentes é o "medo dos ursos". O que o levou a pensar que era esse o significado do componente? O procedimento de componentes principais transforma sua matriz de dados em uma nova matriz de dados com a mesma ou menor quantidade de dimensões, e as dimensões resultantes variam daquela que explica melhor a variação até a que explica menos. Esses componentes são calculados com base em uma combinação das variáveis originais com os vetores próprios calculados. O procedimento geral do PCA converte as variáveis originais em ortogonais (linearmente independentes). Espero que isso ajude você a esclarecer um pouco sobre o procedimento pca
fonte