É aceitável ter apenas dois (ou menos) itens (variáveis) carregados por um fator na análise fatorial?

10

Eu tenho um conjunto de 20 variáveis ​​que eu coloquei na análise fatorial no SPSS. Para fins de pesquisa, preciso desenvolver 6 fatores. O SPSS mostrou que 8 variáveis ​​(em 20) foram carregadas com pesos baixos ou foram carregadas igualmente por vários fatores; portanto, eu as removi. As 12 variáveis ​​restantes foram carregadas em pares de 2 nos 6 fatores, o que é uma estrutura perfeita - exatamente como eu queria, mas agora, um dos professores que trabalha comigo quer que eu encontre justificativas por que (ou sob quais condições) é adequado manter apenas 2 itens por fator, pois é comum saber que a análise fatorial é útil com resultados com 3 ou mais itens carregados, por fator.

Alguém pode me ajudar com esse problema, de preferência também com uma referência publicada?

Mitja
fonte
Um único fator de item também é aceitável se esse item tiver uma carga de fator mais alta.
Meera Gang
"Pelo menos 3 itens por fator" é uma recomendação garantida. Se, após a rotação do fator, você obtiver resultados com 2 ou um item em um fator, 1) obtenha mais variáveis ​​que você espera que sejam carregadas por esse fator ou 2) refaça a análise e extraia menos fatores ou 3) deixe o resulta como está, mas não interpreta o fator "necessitado", dizendo "acredito que esse fator existe, mas como atualmente não é suportado por itens suficientes, retiro-o da interpretação e dos resultados". Todas essas 2 recomendações são diferentes, no entanto.
ttnphns
Veja também, além das respostas aqui, stats.stackexchange.com/a/198684/3277 (ponto 5) por que "Pelo menos 3 itens carregados por fator" é um requisito razoável.
ttnphns

Respostas:

13

Dois ou três itens por fator é uma questão de identificação do seu modelo CFA (FA confirmatória).

Por simplicidade, suponhamos que o modelo seja identificado definindo a variação de cada fator como 1. Suponha também que não haja erros de medição correlacionados.

Um modelo de fator único com dois itens possui duas cargas e duas variações de erro a serem estimadas = 4 parâmetros, mas existem apenas 3 entradas não triviais na matriz de variância-covariância, portanto, você não possui informações suficientes para estimar os quatro parâmetros isto que você precisa.

Um modelo de fator único com três itens possui três cargas e três variações de erro. A matriz de variância-covariância possui seis entradas, e um exame analítico cuidadoso mostra que o modelo está exatamente identificado, e você pode expressar algebricamente as estimativas de parâmetros como funções das entradas da matriz de variância-covariância. Com mais itens por fator único, você tem um modelo superidentificado (mais graus de liberdade que parâmetros), o que geralmente significa que você está pronto para ir.

Com mais de um fator, o modelo CFA é sempre identificado com mais de 3 itens por cada fator (porque um modelo de medição simples é identificado para cada fator, portanto, grosso modo, você pode obter previsões para cada fator e estimar suas covariâncias com base nisso). No entanto, um CFA com dois itens por fator é identificado, desde que cada fator tenha uma covariância diferente de zero com pelo menos um outro fator na população. (Caso contrário, o fator em questão fica fora do sistema e um modelo de fator único de dois itens não é identificado.) A prova de identificação é bastante técnica e requer um bom entendimento da álgebra matricial.

Bollen (1989) discute completa e completamente as questões de identificação de modelos CFA no capítulo 7. Ver p. 244 especificamente sobre regras de três e dois indicadores.

StasK
fonte
11
Esta foi uma resposta muito adequada. Gostaria apenas de comentar (pelo bem do OP) que o OP perguntou sobre a FA exploratória (EFA). É lógico que o EFA tenha "3 ou mais itens carregados por fator", uma vez que o CFA espera; apenas que você não disse sobre isso na sua resposta.
ttnphns
4

Nunca ouvi falar no critério "3 itens por fator". Eu reverteria a pergunta e pediria ao seu professor que apresentasse uma referência sólida para essa afirmação.

Além disso, "para fins de pesquisa, preciso desenvolver 6 fatores". é uma coisa estranha de se dizer.

O objetivo básico da análise fatorial é 1) descobrir quantos fatores (geralmente traços psicológicos) estão subjacentes a um número (maior) de variáveis ​​medidas. Então 2), com base nas cargas fatoriais, tenta-se descrever o que esses fatores realmente são.

Você não "desenvolve" seis fatores, está "tentando medir" seis fatores.

No entanto, as cargas cruzadas (variáveis ​​carregadas por vários fatores) presentes costumam ser uma indicação de que os fatores estão "tentando se correlacionar" entre si. O que faz sentido, pois sabemos que basicamente tudo se correlaciona com tudo no mundo real. A implementação dessa observação em sua análise usando uma rotação oblíqua (em vez da varimax ortogonal) geralmente libera muitas cargas cruzadas. IMHO, é mais som teoricamente também.

Dê uma chance, você pode acabar com mais itens por fator. Isso pode (em parte) resolver o seu problema também.

RubenGeert
fonte
Muito obrigado pelo seu comentário, por que seis fatores eu posso explicar com um modelo que estou usando, meu professor não é contra a explicação de 6 fatores, no entanto, ele quer uma explicação quando é bom usar a análise fatorial que possui apenas 2 itens por fator . Ainda permanece a questão.
Mitja
Bem-vindo ao site, @ pythonforspss.org, há muitas informações boas aqui, +1. Algumas notas: ouvi dizer várias vezes que você precisa de pelo menos três variáveis ​​por fator, mas não sei qual é o motivo (ou se realmente existe) para essa regra. Editei o Q do OP para tornar o inglês mais suave; Coloquei a frase que você cita para substituir o que estava lá antes. Isso pode não ter sido ideal (eu não tinha certeza de como traduzir o que eu pensava que o OP estivesse tentando dizer), mas, se for, é minha culpa, não da Mitja. Lembre-se de que o inglês não é o primeiro idioma de muitos usuários.
gung - Restabelece Monica
os três itens por fator são uma crença comum e tendem a causar problemas no estágio de revisão (como é uma crença comum). Dito isto, se suas comunidades são altas (> 0,7), provavelmente você não tem um problema.
richiemorrisroe
Meus comunalidade são 0,5 ou superior ...
Mitja
factors are "trying to correlate" with each otheré uma formulação mística. Os fatores se correlacionam ou não, de acordo com a forma como os rotacionamos (modelamos). "Cargas cruzadas" bastante altas são possíveis com fatores ortogonais com uma variável com alta comunalidade.
ttnphns
1

Eu tenho o mesmo problema agora. Aqui está um artigo que recomenda o uso de pelo menos 3 itens por fator. Em casos excepcionais, no entanto, você pode usar itens por fator (p.60). http://www.sajip.co.za/index.php/sajip/article/download/168/165 Meu caso parece ser excepcional, pois existem apenas duas variáveis ​​em meu experimento na Web que fornecem informações sobre os estratégia e poder da estratégia. Pode ser que isso também ajude a legitimar o uso de 2 itens por alguns fatores.

eugentango
fonte
11
Este site tem várias referências que suportam o mínimo de três variáveis ​​por regra de fator: encorewiki.org/display/~nzhao/…