Eu tenho um conjunto de 20 variáveis que eu coloquei na análise fatorial no SPSS. Para fins de pesquisa, preciso desenvolver 6 fatores. O SPSS mostrou que 8 variáveis (em 20) foram carregadas com pesos baixos ou foram carregadas igualmente por vários fatores; portanto, eu as removi. As 12 variáveis restantes foram carregadas em pares de 2 nos 6 fatores, o que é uma estrutura perfeita - exatamente como eu queria, mas agora, um dos professores que trabalha comigo quer que eu encontre justificativas por que (ou sob quais condições) é adequado manter apenas 2 itens por fator, pois é comum saber que a análise fatorial é útil com resultados com 3 ou mais itens carregados, por fator.
Alguém pode me ajudar com esse problema, de preferência também com uma referência publicada?
Respostas:
Dois ou três itens por fator é uma questão de identificação do seu modelo CFA (FA confirmatória).
Por simplicidade, suponhamos que o modelo seja identificado definindo a variação de cada fator como 1. Suponha também que não haja erros de medição correlacionados.
Um modelo de fator único com dois itens possui duas cargas e duas variações de erro a serem estimadas = 4 parâmetros, mas existem apenas 3 entradas não triviais na matriz de variância-covariância, portanto, você não possui informações suficientes para estimar os quatro parâmetros isto que você precisa.
Um modelo de fator único com três itens possui três cargas e três variações de erro. A matriz de variância-covariância possui seis entradas, e um exame analítico cuidadoso mostra que o modelo está exatamente identificado, e você pode expressar algebricamente as estimativas de parâmetros como funções das entradas da matriz de variância-covariância. Com mais itens por fator único, você tem um modelo superidentificado (mais graus de liberdade que parâmetros), o que geralmente significa que você está pronto para ir.
Com mais de um fator, o modelo CFA é sempre identificado com mais de 3 itens por cada fator (porque um modelo de medição simples é identificado para cada fator, portanto, grosso modo, você pode obter previsões para cada fator e estimar suas covariâncias com base nisso). No entanto, um CFA com dois itens por fator é identificado, desde que cada fator tenha uma covariância diferente de zero com pelo menos um outro fator na população. (Caso contrário, o fator em questão fica fora do sistema e um modelo de fator único de dois itens não é identificado.) A prova de identificação é bastante técnica e requer um bom entendimento da álgebra matricial.
Bollen (1989) discute completa e completamente as questões de identificação de modelos CFA no capítulo 7. Ver p. 244 especificamente sobre regras de três e dois indicadores.
fonte
Nunca ouvi falar no critério "3 itens por fator". Eu reverteria a pergunta e pediria ao seu professor que apresentasse uma referência sólida para essa afirmação.
Além disso, "para fins de pesquisa, preciso desenvolver 6 fatores". é uma coisa estranha de se dizer.
O objetivo básico da análise fatorial é 1) descobrir quantos fatores (geralmente traços psicológicos) estão subjacentes a um número (maior) de variáveis medidas. Então 2), com base nas cargas fatoriais, tenta-se descrever o que esses fatores realmente são.
Você não "desenvolve" seis fatores, está "tentando medir" seis fatores.
No entanto, as cargas cruzadas (variáveis carregadas por vários fatores) presentes costumam ser uma indicação de que os fatores estão "tentando se correlacionar" entre si. O que faz sentido, pois sabemos que basicamente tudo se correlaciona com tudo no mundo real. A implementação dessa observação em sua análise usando uma rotação oblíqua (em vez da varimax ortogonal) geralmente libera muitas cargas cruzadas. IMHO, é mais som teoricamente também.
Dê uma chance, você pode acabar com mais itens por fator. Isso pode (em parte) resolver o seu problema também.
fonte
factors are "trying to correlate" with each other
é uma formulação mística. Os fatores se correlacionam ou não, de acordo com a forma como os rotacionamos (modelamos). "Cargas cruzadas" bastante altas são possíveis com fatores ortogonais com uma variável com alta comunalidade.Eu tenho o mesmo problema agora. Aqui está um artigo que recomenda o uso de pelo menos 3 itens por fator. Em casos excepcionais, no entanto, você pode usar itens por fator (p.60). http://www.sajip.co.za/index.php/sajip/article/download/168/165 Meu caso parece ser excepcional, pois existem apenas duas variáveis em meu experimento na Web que fornecem informações sobre os estratégia e poder da estratégia. Pode ser que isso também ajude a legitimar o uso de 2 itens por alguns fatores.
fonte