Eu costumava analisar itens do ponto de vista psicométrico. Mas agora estou tentando analisar outros tipos de perguntas sobre motivação e outros tópicos. Essas questões estão todas na escala Likert. Meu pensamento inicial era usar a análise fatorial, porque as perguntas têm a hipótese de refletir algumas dimensões subjacentes.
- Mas a análise fatorial é apropriada?
- É necessário validar cada pergunta em relação à sua dimensionalidade?
- Existe algum problema com a análise fatorial em itens likert?
- Existem bons documentos e métodos sobre como conduzir a análise fatorial no Likert e outros itens categóricos?
Respostas:
Pelo que vi até agora, a FA é usada para itens de atitude, assim como para outros tipos de escalas de classificação. O problema decorrente da métrica usada (ou seja, "as escalas Likert realmente devem ser tratadas como escalas numéricas?" É um debate de longa data, mas, desde que você verifique a distribuição de respostas em forma de sino, você pode tratá-las como medições contínuas, caso contrário, verifique se há modelos de FA não lineares ou escala ideal ) pode ser manipulada por modelos de IRT politômicos, como Resposta Gradual, Escala de Classificação ou Modelo de Crédito Parcial. Os dois últimos podem ser usados como uma verificação aproximada de se as distâncias limiares, como usadas nos itens do tipo Likert, são uma característica do formato de resposta (RSM) ou do item específico (PCM).
Em relação ao seu segundo ponto, sabe-se, por exemplo, que as distribuições de resposta em pesquisas de atitude ou de saúde diferem de um país para outro (por exemplo, o povo chinês tende a destacar padrões de resposta 'extremos' em comparação com os provenientes de países ocidentais, veja, por exemplo, Song (X.-Y. (2007) Análise de modelos de equações estruturais de várias amostras com aplicações para dados de Qualidade de Vida, no Manual de Variáveis Latentes e Modelos Relacionados , Lee, S.-Y. (Ed.), Pp 279-302, North -Holanda). Alguns métodos para lidar com essa situação em cima da minha cabeça:
Agora, o ponto é que a maioria dessas abordagens se concentra no nível do item (efeito teto / piso, confiabilidade reduzida, estatísticas de ajuste incorreto de itens etc.), mas quando alguém está interessado em saber como as pessoas se desviam do que seria esperado de um ideal conjunto de observadores / entrevistados, acho que devemos nos concentrar nos índices de adequação da pessoa.
Tais estatísticas estão prontamente disponíveis para os modelos da TRI, como INFIT ou roupa quadrado médio, mas geralmente elas se aplicam em todo o questionário. Além disso, como a estimativa dos parâmetros dos itens depende em parte dos parâmetros das pessoas (por exemplo, na estrutura de verossimilhança marginal, assumimos uma distribuição gaussiana), a presença de indivíduos afastados pode levar a estimativas potencialmente tendenciosas e a um ajuste inadequado do modelo.χ2
Conforme proposto por Eid e Zickar (2007), a combinação de um modelo de classe latente (para isolar o grupo de respondentes, por exemplo, aqueles que respondem sempre nas categorias extremas versus os outros) e um modelo de TRI (para estimar parâmetros de itens e localização de pessoas no latente característica nos dois grupos) parece uma boa solução. Outras estratégias de modelagem são descritas em seus trabalhos (por exemplo, modelo HYBRID, veja também Holden e Book, 2009).
Da mesma forma, modelos de desdobramento podem ser usados para lidar com o estilo de resposta , que é definido como um padrão consistente e independente de conteúdo da categoria de resposta (por exemplo, tendência a concordar com todas as declarações). Nas ciências sociais ou na literatura psicológica, isso é conhecido como Extreme Response Style (ERS). As referências (1 a 3) podem ser úteis para se ter uma idéia de como ela se manifesta e como pode ser medida.
Aqui está uma pequena lista de trabalhos que podem ajudar a progredir nesse assunto:
fonte
A análise fatorial exploratória (AFE) é apropriada (psicometricamente e de outra forma) para examinar em que medida se pode explicar as correlações entre vários itens, inferindo a influência comum de um fator não medido (ou seja, latente). Se esse não for seu objetivo específico, considere análises alternativas, por exemplo:
A dimensionalidade é o primeiro problema que o EFA pode resolver. Você pode examinar os autovalores da matriz de covariância (como produzindo um gráfico de scree via EFA) e conduzir uma análise paralela para resolver a dimensionalidade de suas medidas. (Consulte também alguns bons conselhos e sugestões alternativas de William Revelle .) Você deve fazer isso com cuidado antes de extrair um número limitado de fatores e rotacioná-los no EFA ou antes de ajustar um modelo com um número específico de fatores latentes usando CFA, SEM ou o gosto. Se uma análise paralela indicar multidimensionalidade, mas seu (primeiro) fator geral supera amplamente todos os outros (ou seja, tem de longe o maior valor próprio / explica a maioria das variações em suas medidas), considere a análise bifatorial (Gibbons & Hedeker, 1992;Reise, Moore e Haviland, 2010 ) .
Muitos problemas surgem na EFA e na modelagem de fatores latentes das classificações da escala Likert. As escalas Likert produzem dados ordinais (isto é, categóricos, politômicos, ordenados), não dados contínuos. A análise fatorial geralmente assume que qualquer entrada de dados brutos é contínua, e as pessoas geralmente realizam análises fatoriais de matrizes de correlações produto-momento da Pearson, que são apropriadas apenas para dados contínuos. Aqui está uma citação de Reise e colegas (2010) :
Eu recomendaria combinar a primeira e a terceira abordagens (ou seja, usar estimativa de mínimos quadrados ponderada na diagonal em uma matriz de correlação policórica), com base na discussão de Wang e Cunningham (2005) sobre os problemas com alternativas típicas:
Não está claro para mim se a mesma preocupação com a estimativa ponderada de mínimos quadrados se aplica à estimativa DWLS; independentemente, os autores recomendam esse estimador. Caso você ainda não possua os meios:
2.15.2
) para estes pacotes:psych
pacote (Revelle, 2013) contém apolychoric
funçãofa.parallel
função pode ajudar a identificar o número de fatores a serem extraídos.lavaan
pacote (Rosseel, 2012) oferece estimativa DWLS para análise de variáveis latentes.semTools
pacote contém osefaUnrotate
,orthRotate
eoblqRotate
funções.mirt
pacote (Chalmers, 2012) oferece alternativas promissoras usando a teoria da resposta ao item.Imagino que o Mplus (Muthén & Muthén, 1998-2011) também funcione, mas a versão demo gratuita não acomoda mais de seis medições e a versão licenciada não é barata. Pode valer a pena se você puder pagar; as pessoas gostam Mplus , e os Muthéns' serviço ao cliente via seus fóruns é incrível!
Como mencionado acima, a estimativa do DWLS supera o problema das violações da suposição de normalidade (univariadas e multivariadas), que é um problema muito comum e quase onipresente nos dados de classificação da escala Likert. No entanto, não é necessariamente um problema pragmático conseqüente; a maioria dos métodos não é muito sensível a (fortemente influenciada por) pequenas violações (cf. O teste de normalidade é 'essencialmente inútil'? ). A resposta da @ chl a essa pergunta levanta pontos e sugestões mais importantes e excelentes, também com relação a problemas com estilo de resposta extremo; definitivamente um problema com as classificações na escala Likert e outros dados subjetivos.
Referências
· Babakus, E., Ferguson, JCE, & Jöreskog, KG (1987). A sensibilidade da análise fatorial confirmatória de máxima verossimilhança a violações da escala de medição e premissas distributivas. Journal of Marketing Research, 24 , 222-228.
· Byrne, BM (2006). Modelagem de Equações Estruturais com EQS. Mahwah, NJ: Lawrence Erlbaum.
· Chalmers, RP (2012). mirt: um pacote de teoria multidimensional de resposta a itens para o ambiente R. Journal of Statistical Software, 48 (6), 1–29. Recuperado em http://www.jstatsoft.org/v48/i06/ .
· Gibbons, RD, & Hedeker, DR (1992). Análise bi-fator de item com informações completas. Psychometrika, 57 , 423-436.
· Knol, DL, e Berger, MPF (1991). Comparação empírica entre análise fatorial e modelos multidimensionais de resposta a itens. Pesquisa Comportamental Multivariada, 26 , 457–477.
· Muthén, LK e Muthén, BO (1998-2011). Guia do usuário do Mplus (6ª ed.). Los Angeles, CA: Muthén e Muthén.
· Muthén, LK e Muthén, BO (2009). Mplus (versão 4.00). [Software de computador]. Los Angeles, CA: Autor. URL: http://www.statmodel.com .
· Olsson, U. (1979). Estimativas de máxima verossimilhança para o coeficiente de correlação policórica. Psychometrika, 44 , 443-460.
·R Equipe principal. (2012). R: Uma linguagem e ambiente para computação estatística. Fundação R para Computação Estatística, Viena, Áustria. ISBN 3-900051-07-0, URL: http://www.R-project.org/ .
· Reise, SP, Moore, TM e Haviland, MG (2010). Modelos e rotações bifatoriais: explorando até que ponto os dados multidimensionais produzem pontuações unívocas na escala. Journal of Personality Assessment, 92 (6), 544–559. Recuperado em http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2981404/ .
· Revelle, W. (2013). psych: Procedimentos para Personalidade e Pesquisa Psicológica. Universidade Northwestern, Evanston, Illinois, EUA. Recuperado em http://CRAN.R-project.org/package=psych . Versão = 1.3.2.
· Rosseel, Y. (2012). lavaan: Um pacote R para modelagem de equações estruturais. Journal of Statistical Software, 48 (2), 1–36. Recuperado em http://www.jstatsoft.org/v48/i02/ .
· Wang, WC, & Cunningham, EG (2005). Comparação de métodos alternativos de estimativa em análises fatoriais confirmatórias do General Health Questionnaire. Relatórios Psicológicos, 97 , 3-10.
· Wirth, RJ, e Edwards, MC (2007). Análise fatorial de item: abordagens atuais e orientações futuras. Métodos psicológicos, 12 , 58-79. Recuperado em http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3162326/ .
fonte
Apenas uma pequena nota de que você pode querer observar a correlação policórica com a análise fatorial, em vez da matriz tradicional de correlação / covariância.
http://www.john-uebersax.com/stat/sem.htm
fonte