Atualmente, estou passando por um conjunto de slides que tenho para "análise fatorial" (PCA, tanto quanto eu sei).
Nele, é derivado o "teorema fundamental da análise fatorial", que afirma que a matriz de correlação dos dados que entram na análise ( ) pode ser recuperada usando a matriz de cargas fatoriais ( A ):
Isso, no entanto, me confunde. No PCA, a matriz de "cargas fatoriais" é dada pela matriz de vetores próprios da matriz de covariância / correlação dos dados (já que estamos assumindo que os dados foram padronizados, eles são os mesmos), com cada vetor próprio dimensionado para ter comprimento um. Esta matriz é ortogonal, assim que é, em geral, não é igual a R .
pca
factor-analysis
terminology
definition
user2249626
fonte
fonte
A
(que são carregamentos), por razões de clareza. A matriz de vetor próprio (do lado direito) geralmente é rotuladaV
(porqueR=USV'
por svd), nãoA
. Outro nome equivalente (proveniente da terminologia biplot) para vetores próprios é "coordenadas padrão" e para cargas é "coordenadas principais".Respostas:
Esta é uma pergunta razoável (+1) que decorre da ambiguidade e confusão terminológicas.
No contexto da APC, as pessoas costumam chamar eixos principais (vetores próprios da matriz de covariância / correlação) de "cargas". Esta é uma terminologia desleixada. O que deveria ser chamado de "loadings" no PCA, são os principais eixos dimensionados pelas raízes quadradas dos respectivos autovalores. Então o teorema a que você está se referindo se manterá.
Consulte minha resposta aqui para obter mais informações sobre a reconstrução de matrizes de covariância com análise fatorial e cargas de PCA.
fonte