Quero verificar se realmente entendi a análise fatorial (FA) [clássica, linear] , especialmente as suposições feitas antes (e possivelmente depois) da FA.
Alguns dados devem ser inicialmente correlacionados e existe uma possível relação linear entre eles. Após a análise fatorial, os dados são normalmente distribuídos (distribuição bivariada para cada par) e não há correlação entre fatores (comuns e específicos), nem correlação entre variáveis de um fator e variáveis de outros fatores.
Está correto?
Binary data should also be avoided
, para que outro método de análise fatorial podemos fazerbinary data
?Na maioria das vezes, a análise fatorial é realizada sem testes estatísticos per se. É muito mais subjetivo e interpretativo do que métodos como regressão, modelagem de equações estruturais e assim por diante. E geralmente são os testes inferenciais que vêm com suposições: para que os valores de p e os intervalos de confiança estejam corretos, essas suposições devem ser atendidas.
Agora, se o método para escolher o número de fatores estiver definido como o método de máxima verossimilhança, existe uma suposição: o de que as variáveis inseridas na análise de fatores terão distribuições normais.
O fato de as variáveis de entrada terem correlações diferentes de zero é uma espécie de suposição, pois, sem que isso seja verdade, os resultados da análise fatorial serão (provavelmente) inúteis: nenhum fator emergirá como a variável latente por trás de algum conjunto de variáveis de entrada.
Na medida em que "não há correlação entre fatores (comuns e específicos) e nenhuma correlação entre variáveis de um fator e variáveis de outros fatores", essas não são suposições universalmente feitas pelos analistas de fatores, embora às vezes seja uma condição (ou uma aproximação) ) pode ser desejável. Este último, quando se sustenta, é conhecido como "estrutura simples".
Há outra condição que às vezes é tratada como uma "suposição": que as correlações de ordem zero (baunilha) entre variáveis de entrada não sejam inundadas por grandes correlações parciais. Em resumo, o que isso significa é que os relacionamentos devem ser fortes para alguns pares e fracos para outros; caso contrário, os resultados serão "enlameados". Isso está relacionado à conveniência de uma estrutura simples e, na verdade, pode ser avaliada (embora não formalmente "testada") usando a estatística Kaiser-Meyer-Olkin ou o KMO. Valores de KMO próximos de 0,8 ou 0,9 são geralmente considerados muito promissores para resultados informativos de análise de fatores, enquanto KMOs próximos de 0,5 ou 0,6 são muito menos promissores, e aqueles abaixo de 0,5 podem levar um analista a repensar sua estratégia.
fonte
As premissas subjacentes à análise fatorial exploratória são:
• Nível de intervalo ou razão de medição
• Amostragem aleatória
• Relação entre variáveis observadas é linear
• Uma distribuição normal (cada variável observada)
• Uma distribuição normal bivariada (cada par de variáveis observadas)
• Normalidade multivariada
Acima de o arquivo SAS
fonte