Entendendo a análise fatorial

8

Posso entender a análise fatorial da seguinte maneira?

Suponha que eu tenho 5 variáveis ​​independentes (A, B, C, D, E)

A análise fatorial permite que eu faça (D, E) serem variáveis ​​dependentes e permita que elas sejam combinações lineares de (A, B, C).

Portanto, precisarei apenas transportar dados (A, B, C) e os Λ matriz, então eu posso recriar dados (D, E) por dados (A, B, C) e o Λ matriz.

Faz apenas a redução de dados. Estou certo?

Marco
fonte
5
Votei esta questão porque é razoável. Perguntas bem formuladas que expõem mal-entendidos devem ser bem-vindas (e votadas para indicar isso), não menosprezadas com votos negativos, porque podem gerar ótimas respostas como a que o @StasK já ofereceu aqui.
whuber

Respostas:

18

Não. Na análise fatorial, todas as variáveis ​​são variáveis ​​dependentes e dependem de fatores latentes (e também contêm erros de medição). Embora as pontuações fatoriais sejam frequentemente usadas no lugar das variáveis ​​originais, o que pode parecer um problema de redução de dados, é exatamente isso que a análise fatorial visa. Em outras palavras, em vez de dizer: "Uau, eu tenho muitos dados que realmente não consigo processar e entender; posso criar um truque para ter menos variáveis?", A análise fatorial geralmente é realizada na situação " Como não consigo medir uma coisa diretamente, tentarei abordagens diferentes; sei que terei muitos dados, mas isso seria um dado relacionado à estrutura conhecida, e poderei explorar essa estrutura para aprender sobre essa coisa. que eu não pude medir diretamente ".

O que você descreveu se qualifica como regressão multivariada (não confunda com regressão múltipla, que engloba uma variável dependente e muitas variáveis ​​explicativas; a regressão multivariada possui muitas variáveis ​​dependentes e o mesmo conjunto de variáveis ​​explicativas em cada regressão individual) ou correlações canônicas ( com um pouco de imaginação), ou um modelo de equação estrutural de múltiplos indicadores e causas múltiplas. Mas não, isso não é análise fatorial.

StasK
fonte
1

para adicionar à excelente resposta do @ StasK, esclarecerei mais dizendo que esse problema se enquadra no âmbito geral da modelagem de equações estruturais (SEM). O SEM é uma técnica que pode ser empregada para modelar estruturas de covariância e, embora normalmente seja usada com variáveis ​​não observadas ou latentes, também pode ser aplicada a modelos com apenas variáveis ​​observadas ou manifestas. aplicando metodologia e terminologia SEM ao seu problema, D e E seriam consideradas variáveis ​​endógenas, enquanto A, B e C são variáveis ​​exógenas. a endogenia sugere que a variação na variável específica é explicada por outra variável, enquanto a exogenia sugere que a variação não é explicada por outra variável, latente ou manifesta.

werner wothke fornece alguns bons slides introduzindo o SEM usando SAS aqui .

procure também o site de ed rigdon discutindo uma variedade de problemas SEM (muito novo, não é possível vincular!).

voltando ao básico, se seu objetivo é entender a análise fatorial, sugiro começar com um texto aplicado, como a análise fatorial confirmatória de brown para a pesquisa aplicada .

allinonemove
fonte
1
A página de Ed Rigdon é www2.gsu.edu/~mkteer . Para tornar essa resposta ainda mais completa, eu acrescentaria que o MEV com variáveis ​​observadas só foi estudado pela primeira vez em econometria na década de 1950, com o título de modelos de equações simultâneas. O excelente livro de Ken Bollen ( amazon.com/Structural-Equations-Latent-Variables-Kenneth/dp/… ) é na verdade um dos poucos livros sobre SEM que o cobre com detalhes suficientes para aprender algo útil.
StasK