Interpretando pontuações do PCA

16

Alguém pode me ajudar na interpretação das pontuações do PCA? Meus dados vêm de um questionário sobre atitudes em relação aos ursos. De acordo com os carregamentos, interpretei um dos meus principais componentes como "medo de ursos". As pontuações desse componente principal estariam relacionadas à forma como cada respondente mede até aquele componente principal (se ele / ela pontua positiva / negativamente)?

mdewey
fonte
A resposta curta para sua pergunta é SIM.
Ameba diz Reinstate Monica

Respostas:

13

Basicamente, as pontuações dos fatores são calculadas como as respostas brutas ponderadas pelas cargas de fatores. Portanto, é necessário examinar as cargas fatoriais de sua primeira dimensão para ver como cada variável se relaciona com o componente principal. Observar altas cargas positivas (resp. Negativas) associadas a variáveis ​​específicas significa que essas variáveis ​​contribuem positivamente (resp. Negativamente) para esse componente; portanto, as pessoas que pontuam alto nessas variáveis ​​tendem a ter pontuações mais altas (respectivamente inferiores) nessa dimensão específica.

Desenhar o círculo de correlação é útil para ter uma idéia geral das variáveis ​​que contribuem "positivamente" vs. "negativamente" (se houver) para o primeiro eixo principal, mas se você estiver usando R, poderá ver o pacote FactoMineR e a dimdesc()função

Aqui está um exemplo com os USArrestsdados:

> data(USArrests)
> library(FactoMineR)
> res <- PCA(USArrests)
> dimdesc(res, axes=1)  # show correlation of variables with 1st axis
$Dim.1
$Dim.1$quanti
         correlation  p.value
Assault        0.918 5.76e-21
Rape           0.856 2.40e-15
Murder         0.844 1.39e-14
UrbanPop       0.438 1.46e-03
> res$var$coord  # show loadings associated to each axis
         Dim.1  Dim.2  Dim.3   Dim.4
Murder   0.844 -0.416  0.204  0.2704
Assault  0.918 -0.187  0.160 -0.3096
UrbanPop 0.438  0.868  0.226  0.0558
Rape     0.856  0.166 -0.488  0.0371

Como pode ser visto no resultado mais recente, a primeira dimensão reflete principalmente atos violentos (de qualquer tipo). Se olharmos para o mapa individual, fica claro que os estados localizados à direita são aqueles onde esses atos são mais frequentes.

texto alternativo texto alternativo

Você também pode estar interessado nesta pergunta relacionada: Quais são as pontuações dos componentes principais?

chl
fonte
5

Para mim, as pontuações do PCA são apenas rearranjos dos dados de uma forma que me permite explicar o conjunto de dados com menos variáveis. As pontuações representam o quanto cada item se relaciona com o componente. Você pode nomeá-los de acordo com a análise fatorial, mas é importante lembrar que não são variáveis ​​latentes, pois o PCA analisa toda a variação no conjunto de dados, não apenas os elementos mantidos em comum (como a análise fatorial).

richiemorrisroe
fonte
Sim, você está certo ao dizer que nenhum modelo de erro é incorporado ao PCA, em oposição ao FA. Eu tenho +1 para esse ponto em particular. Observe que eu disse "faz sentido considerar", não que os principais componentes extraídos do PCA sejam verdadeiros LVs. A menos que você esteja interessado em avaliar a confiabilidade da escala ou os modelos de medição, faz pouca diferença se você usa PCA ou FA. Agora, a análise de dados geralmente se preocupa em explicar a correlação entre variáveis ​​ou encontrar grupos de sujeitos, daí a ideia de interpretar uma ou mais dimensões do espaço fatorial. (...)
chl
(...) O FactoMineR inclui um conjunto de dados sobre vinhos, e muitos métodos de fatores podem ser usados ​​para brincar com ele (PCA, MFA) e até PLS ou CCA, como foi feito por Michel Tenenhaus.
chl
@ chl, Obrigado pela dica sobre o pacote, vou verificar isso. Em PCA vs FA, eu concordo até certo ponto. Prefiro AF para a maioria das aplicações, pois financio as estimativas de comunalidade (a variância comum) para ser muito útil na avaliação do valor de uma estrutura de fatores específica. Isso pode ser apenas uma preferência pessoal, no entanto.
Novidade
Você está totalmente certo (eu já votei em sua resposta anterior porque foi esclarecida). É que o PCA (não rotacionado) tem seu próprio histórico em análise de dados (especialmente a escola francesa), junto com CA, MFA, MCA. Por outro lado, Paul Kline tem dois livros muito bons sobre o uso da FA na pesquisa de personalidade. E o próximo livro de William Revelle deve ser bom para os usuários do R :) Bem, de qualquer forma, acho que concordamos que essas são ferramentas úteis para analisar a estrutura de uma matriz de correlação.
fácil
0

Os resultados do PCA (as diferentes dimensões ou componentes) geralmente não podem ser traduzidos em um conceito real. Acho errado assumir que um dos componentes é o "medo dos ursos". O que o levou a pensar que era esse o significado do componente? O procedimento de componentes principais transforma sua matriz de dados em uma nova matriz de dados com a mesma ou menor quantidade de dimensões, e as dimensões resultantes variam daquela que explica melhor a variação até a que explica menos. Esses componentes são calculados com base em uma combinação das variáveis ​​originais com os vetores próprios calculados. O procedimento geral do PCA converte as variáveis ​​originais em ortogonais (linearmente independentes). Espero que isso ajude você a esclarecer um pouco sobre o procedimento pca

mariana soffer
fonte
Você concorda que uma combinação linear de algumas variáveis ​​ainda pode ser interpretada como refletindo algum tipo de contribuição ponderada de cada uma delas para o eixo fatorial?
chl
Sim, é exatamente isso.
Mariana soffer #
Então, por que evitar dar um nome a ele? As variáveis ​​são consideradas apenas como variáveis ​​manifestas e, em alguns casos, faz sentido considerar sua combinação ponderada como refletindo um fator latente (não observado).
chl