Qual o significado da produção factanal do R?

8

O que tudo isso significa? Sou uma análise fatorial 'noob' e, embora tenha lido um livro, aparentemente não me contou tudo.

Como a estatística do quadrado do qui é tão alta e o valor de p tão baixo, parece que os dados estão perto de serem coplanares (2 dimensões) dentro do espaço 6-dimensional. No entanto, isso representa apenas 89,4% da variação (estou interpretando esse direito?)

Além disso, eu pensei que os fatores eram ortogonais entre si, então como os dois fatores podem ter cargas positivas para cada variável?

E o que significam as singularidades?

> factanal(charges[3:8],2)

Call:
factanal(x = charges[3:8], factors = 2)

Uniquenesses:
      APT    CHELPG   Natural       AIM Hirshfeld       VDD 
    0.217     0.250     0.082     0.052     0.005     0.033 

Loadings:
          Factor1 Factor2
APT       0.609   0.642  
CHELPG    0.657   0.564  
Natural   0.571   0.769  
AIM       0.382   0.896  
Hirshfeld 0.910   0.408  
VDD       0.844   0.504  

               Factor1 Factor2
SS loadings      2.817   2.544
Proportion Var   0.470   0.424
Cumulative Var   0.470   0.894

Test of the hypothesis that 2 factors are sufficient.
The chi square statistic is 77.1 on 4 degrees of freedom.
The p-value is 7.15e-16 
>
David Shobe
fonte
@SeanMurphy: Obrigado! Agora, eu entendo que a análise fatorial "fatores" (aproximadamente) a matriz de dados 160x6 em uma matriz de pontuação de 160x2 e em uma matriz de cargas 2x6. A saída me fornece a matriz de cargas, mas também estou interessado na matriz de pontuações. Como faço para conseguir isso? De preferência, de uma forma que eu possa exportar e / ou plotar.
David Shobe

Respostas:

15

A estatística do qui-quadrado e o valor p no factanal estão testando a hipótese de que o modelo se ajusta perfeitamente aos dados. Quando o valor de p é baixo, como é aqui, podemos rejeitar esta hipótese - portanto, neste caso, o modelo de 2 fatores não se ajusta perfeitamente aos dados (isso é o oposto de como você está interpretando a saída).

Vale a pena notar que 89,4% da variação explicada por dois fatores é muito alta, por isso não sei por que o 'único'.

Os fatores em si são não correlacionados (ortogonais), mas isso não significa que as medidas individuais não possam se correlacionar com os dois fatores. Pense nas direções Norte e Leste em uma bússola - elas não estão correlacionadas, mas o Nordeste 'carregaria' ambas positivamente.

As exclusões são a variação em cada item que não é explicada pelos dois fatores.

Esse link pode ser útil para sua interpretação.

Sean Murphy
fonte