Análise fatorial de questionários compostos por itens Likert

17

Eu costumava analisar itens do ponto de vista psicométrico. Mas agora estou tentando analisar outros tipos de perguntas sobre motivação e outros tópicos. Essas questões estão todas na escala Likert. Meu pensamento inicial era usar a análise fatorial, porque as perguntas têm a hipótese de refletir algumas dimensões subjacentes.

  • Mas a análise fatorial é apropriada?
  • É necessário validar cada pergunta em relação à sua dimensionalidade?
  • Existe algum problema com a análise fatorial em itens likert?
  • Existem bons documentos e métodos sobre como conduzir a análise fatorial no Likert e outros itens categóricos?
pbneau
fonte
Se entendi corretamente, sua pergunta abrange pelo menos dois tópicos diferentes: (1) uso de AF em escalas de atitude ou motivacionais e (2) como lidar com padrões 'extremos' de respostas (efeitos de teto / piso) nessas escalas?
chl

Respostas:

22

Pelo que vi até agora, a FA é usada para itens de atitude, assim como para outros tipos de escalas de classificação. O problema decorrente da métrica usada (ou seja, "as escalas Likert realmente devem ser tratadas como escalas numéricas?" É um debate de longa data, mas, desde que você verifique a distribuição de respostas em forma de sino, você pode tratá-las como medições contínuas, caso contrário, verifique se há modelos de FA não lineares ou escala ideal ) pode ser manipulada por modelos de IRT politômicos, como Resposta Gradual, Escala de Classificação ou Modelo de Crédito Parcial. Os dois últimos podem ser usados ​​como uma verificação aproximada de se as distâncias limiares, como usadas nos itens do tipo Likert, são uma característica do formato de resposta (RSM) ou do item específico (PCM).

Em relação ao seu segundo ponto, sabe-se, por exemplo, que as distribuições de resposta em pesquisas de atitude ou de saúde diferem de um país para outro (por exemplo, o povo chinês tende a destacar padrões de resposta 'extremos' em comparação com os provenientes de países ocidentais, veja, por exemplo, Song (X.-Y. (2007) Análise de modelos de equações estruturais de várias amostras com aplicações para dados de Qualidade de Vida, no Manual de Variáveis ​​Latentes e Modelos Relacionados , Lee, S.-Y. (Ed.), Pp 279-302, North -Holanda). Alguns métodos para lidar com essa situação em cima da minha cabeça:

  • uso de modelos log-lineares (abordagem marginal) para destacar um forte desequilíbrio entre os grupos no nível do item (os coeficientes são então interpretados como riscos relativos em vez de probabilidades);
  • o método SEM de várias amostras da Song citado acima (embora não saiba se eles trabalham mais nessa abordagem).

Agora, o ponto é que a maioria dessas abordagens se concentra no nível do item (efeito teto / piso, confiabilidade reduzida, estatísticas de ajuste incorreto de itens etc.), mas quando alguém está interessado em saber como as pessoas se desviam do que seria esperado de um ideal conjunto de observadores / entrevistados, acho que devemos nos concentrar nos índices de adequação da pessoa.

Tais estatísticas estão prontamente disponíveis para os modelos da TRI, como INFIT ou roupa quadrado médio, mas geralmente elas se aplicam em todo o questionário. Além disso, como a estimativa dos parâmetros dos itens depende em parte dos parâmetros das pessoas (por exemplo, na estrutura de verossimilhança marginal, assumimos uma distribuição gaussiana), a presença de indivíduos afastados pode levar a estimativas potencialmente tendenciosas e a um ajuste inadequado do modelo.χ2

Conforme proposto por Eid e Zickar (2007), a combinação de um modelo de classe latente (para isolar o grupo de respondentes, por exemplo, aqueles que respondem sempre nas categorias extremas versus os outros) e um modelo de TRI (para estimar parâmetros de itens e localização de pessoas no latente característica nos dois grupos) parece uma boa solução. Outras estratégias de modelagem são descritas em seus trabalhos (por exemplo, modelo HYBRID, veja também Holden e Book, 2009).

Da mesma forma, modelos de desdobramento podem ser usados ​​para lidar com o estilo de resposta , que é definido como um padrão consistente e independente de conteúdo da categoria de resposta (por exemplo, tendência a concordar com todas as declarações). Nas ciências sociais ou na literatura psicológica, isso é conhecido como Extreme Response Style (ERS). As referências (1 a 3) podem ser úteis para se ter uma idéia de como ela se manifesta e como pode ser medida.

Aqui está uma pequena lista de trabalhos que podem ajudar a progredir nesse assunto:

  1. Hamilton, DL (1968). Atributos de personalidade associados ao estilo de resposta extremo . Boletim Psicológico , 69 (3) : 192–203.
  2. Greanleaf, EA (1992). Medindo o estilo de resposta extrema. Public Opinion Quaterly , 56 (3) : 328-351.
  3. de Jong, MG, Steenkamp, ​​J.-BEM, Fox, J.-P. e Baumgartner, H. (2008). Utilizando a Teoria da Resposta ao Item para Medir o Estilo de Resposta Extrema na Pesquisa de Marketing: Uma Investigação Global. Journal of marketing research , 45 (1) : 104-115.
  4. Morren, M., Gelissen, J. e Vermunt, JK (2009). Lidando com o estilo de resposta extrema na pesquisa transcultural: uma abordagem restrita da análise de fatores de classe latente
  5. Moors, G. (2003). Diagnosticando o comportamento do estilo de resposta por meio de uma abordagem de fator de classe latente. Correlatos sociodemográficos das atitudes do papel de gênero e percepções de discriminação étnica reexaminadas. Qualidade e quantidade , 37 (3), 277-302.
  6. de Jong, MG Steenkamp JB, Fox, J.-P. e Baumgartner, H. (2008). Teoria da resposta ao item para medir o estilo de resposta extrema na pesquisa de marketing: uma investigação global. Jornal de Pesquisa de Marketing , 45 (1), 104-115.
  7. Javaras, KN ​​e Ripley, BD (2007). Um modelo variável latente "desdobrável" para dados de atitude do Likert. JASA , 102 (478): 454-463.
  8. slides de Moustaki, Knott e Mavridis, Métodos para detectar discrepantes em modelos variáveis ​​latentes
  9. Eid, M. e Zickar, MJ (2007). Detectando estilos de resposta e falsificações nas avaliações de personalidade e organizacionais por Modelos Rasch Mistos. Em von Davier, M. e Carstensen, CH (Eds.), Modelos Rasch de distribuição multivariada e de mistura , pp. 255-270, Springer.
  10. Holden, RR e Book, AS (2009). Usando a modelagem híbrida de classe Rasch-latente para melhorar a detecção de falsificadores em um inventário de personalidade. Personalidade e diferenças individuais , 47 (3) : 185-190.
chl
fonte
Links quebrados para Hamilton (1968) e Morren, Gelissen e Vermunt (2009) ... chatice! Também não foi possível encontrar fontes alternativas no Google Scholar (embora ainda não tenha experimentado o Google antigo comum).
Nick Stauner
13

A análise fatorial exploratória (AFE) é apropriada (psicometricamente e de outra forma) para examinar em que medida se pode explicar as correlações entre vários itens, inferindo a influência comum de um fator não medido (ou seja, latente). Se esse não for seu objetivo específico, considere análises alternativas, por exemplo:

  • Modelagem linear geral (por exemplo, regressão múltipla, correlação canônica ou (M) AN (C) OVA)
  • Análise fatorial confirmatória (CFA) ou análise latente de características / classes / perfis
  • Modelagem de equações estruturais (SEM) / mínimos quadrados parciais

A dimensionalidade é o primeiro problema que o EFA pode resolver. Você pode examinar os autovalores da matriz de covariância (como produzindo um gráfico de scree via EFA) e conduzir uma análise paralela para resolver a dimensionalidade de suas medidas. (Consulte também alguns bons conselhos e sugestões alternativas de William Revelle .) Você deve fazer isso com cuidado antes de extrair um número limitado de fatores e rotacioná-los no EFA ou antes de ajustar um modelo com um número específico de fatores latentes usando CFA, SEM ou o gosto. Se uma análise paralela indicar multidimensionalidade, mas seu (primeiro) fator geral supera amplamente todos os outros (ou seja, tem de longe o maior valor próprio / explica a maioria das variações em suas medidas), considere a análise bifatorial (Gibbons & Hedeker, 1992;Reise, Moore e Haviland, 2010 ) .

Muitos problemas surgem na EFA e na modelagem de fatores latentes das classificações da escala Likert. As escalas Likert produzem dados ordinais (isto é, categóricos, politômicos, ordenados), não dados contínuos. A análise fatorial geralmente assume que qualquer entrada de dados brutos é contínua, e as pessoas geralmente realizam análises fatoriais de matrizes de correlações produto-momento da Pearson, que são apropriadas apenas para dados contínuos. Aqui está uma citação de Reise e colegas (2010) :

Técnicas comuns de análise fatorial confirmatória não se aplicam a dados dicotômicos ou politômicos (Byrne, 2006) . Em vez disso, são necessários procedimentos especiais de estimativa (Wirth & Edwards, 2007) . Basicamente, existem três opções para trabalhar com dados de resposta de itens politômicos. O primeiro é calcular uma matriz policórica e, em seguida, aplicar métodos de análise fatorial padrão (ver Knol & Berger, 1991) . Uma segunda opção é usar a análise fatorial de itens com informações completas (Gibbons & Hedeker, 1992) . O terceiro é usar procedimentos limitados de estimativa de informações projetados especificamente para dados ordenados, como mínimos quadrados ponderados com ajuste de média e variância (MPLUS; Muthén & Muthén, 2009) .

Eu recomendaria combinar a primeira e a terceira abordagens (ou seja, usar estimativa de mínimos quadrados ponderada na diagonal em uma matriz de correlação policórica), com base na discussão de Wang e Cunningham (2005) sobre os problemas com alternativas típicas:

Quando a análise fatorial confirmatória foi conduzida com dados ordinais não normais, usando máxima verossimilhança e com base nas correlações produto-momento de Pearson, as estimativas de parâmetros descendentes produzidas neste estudo foram consistentes com os achados de Olsson (1979) . Em outras palavras, a magnitude da não normalidade nas variáveis ​​ordinais observadas é um dos principais determinantes da precisão das estimativas de parâmetros.

Os resultados também corroboram os achados de Babakus, et al. (1987) . Quando a estimativa da máxima verossimilhança é usada com uma matriz de entrada de correlação policórica nas análises fatoriais confirmatórias, as soluções tendem a resultar em valores qui-quadrado inaceitáveis ​​e, portanto, significativos, juntamente com estatísticas de ajuste inadequadas.

Resta a questão de saber se os pesquisadores devem usar estimadores de mínimos quadrados ponderados ou diagonalmente ponderados na estimativa de modelos de equações estruturais com dados categóricos não normais. Nem a estimativa de mínimos quadrados ponderados nem a estimativa de mínimos quadrados ponderados na diagonal fazem suposições sobre a natureza da distribuição das variáveis ​​e ambos os métodos produzem resultados assintoticamente válidos. No entanto, como a estimativa dos mínimos quadrados ponderados é baseada em momentos de quarta ordem, essa abordagem frequentemente leva a problemas práticos e é muito exigida em termos computacionais. Isso significa que a estimativa de mínimos quadrados ponderados pode não ter robustez quando usada para avaliar modelos de médio, ou seja, com 10 indicadores, para tamanho grande e tamanho de amostra pequeno a moderado.

Não está claro para mim se a mesma preocupação com a estimativa ponderada de mínimos quadrados se aplica à estimativa DWLS; independentemente, os autores recomendam esse estimador. Caso você ainda não possua os meios:

  • R (R Core Team, 2012) é gratuito. Você precisará de uma versão antiga (por exemplo, 2.15.2) para estes pacotes:
    • O psychpacote (Revelle, 2013) contém a polychoricfunção
      • A fa.parallelfunção pode ajudar a identificar o número de fatores a serem extraídos.
    • O lavaanpacote (Rosseel, 2012) oferece estimativa DWLS para análise de variáveis ​​latentes.
    • O semToolspacote contém os efaUnrotate, orthRotatee oblqRotatefunções.
    • O mirtpacote (Chalmers, 2012) oferece alternativas promissoras usando a teoria da resposta ao item.

Imagino que o Mplus (Muthén & Muthén, 1998-2011) também funcione, mas a versão demo gratuita não acomoda mais de seis medições e a versão licenciada não é barata. Pode valer a pena se você puder pagar; as pessoas gostam Mplus , e os Muthéns' serviço ao cliente via seus fóruns é incrível!

Como mencionado acima, a estimativa do DWLS supera o problema das violações da suposição de normalidade (univariadas e multivariadas), que é um problema muito comum e quase onipresente nos dados de classificação da escala Likert. No entanto, não é necessariamente um problema pragmático conseqüente; a maioria dos métodos não é muito sensível a (fortemente influenciada por) pequenas violações (cf. O teste de normalidade é 'essencialmente inútil'? ). A resposta da @ chl a essa pergunta levanta pontos e sugestões mais importantes e excelentes, também com relação a problemas com estilo de resposta extremo; definitivamente um problema com as classificações na escala Likert e outros dados subjetivos.


Referências
· Babakus, E., Ferguson, JCE, & Jöreskog, KG (1987). A sensibilidade da análise fatorial confirmatória de máxima verossimilhança a violações da escala de medição e premissas distributivas. Journal of Marketing Research, 24 , 222-228.
· Byrne, BM (2006). Modelagem de Equações Estruturais com EQS. Mahwah, NJ: Lawrence Erlbaum.
· Chalmers, RP (2012). mirt: um pacote de teoria multidimensional de resposta a itens para o ambiente R. Journal of Statistical Software, 48 (6), 1–29. Recuperado em http://www.jstatsoft.org/v48/i06/ .
· Gibbons, RD, & Hedeker, DR (1992). Análise bi-fator de item com informações completas. Psychometrika, 57 , 423-436.
· Knol, DL, e Berger, MPF (1991). Comparação empírica entre análise fatorial e modelos multidimensionais de resposta a itens. Pesquisa Comportamental Multivariada, 26 , 457–477.
· Muthén, LK e Muthén, BO (1998-2011). Guia do usuário do Mplus (6ª ed.). Los Angeles, CA: Muthén e Muthén.
· Muthén, LK e Muthén, BO (2009). Mplus (versão 4.00). [Software de computador]. Los Angeles, CA: Autor. URL: http://www.statmodel.com .
· Olsson, U. (1979). Estimativas de máxima verossimilhança para o coeficiente de correlação policórica. Psychometrika, 44 , 443-460.
·R Equipe principal. (2012). R: Uma linguagem e ambiente para computação estatística. Fundação R para Computação Estatística, Viena, Áustria. ISBN 3-900051-07-0, URL: http://www.R-project.org/ .
· Reise, SP, Moore, TM e Haviland, MG (2010). Modelos e rotações bifatoriais: explorando até que ponto os dados multidimensionais produzem pontuações unívocas na escala. Journal of Personality Assessment, 92 (6), 544–559. Recuperado em http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2981404/ .
· Revelle, W. (2013). psych: Procedimentos para Personalidade e Pesquisa Psicológica. Universidade Northwestern, Evanston, Illinois, EUA. Recuperado em http://CRAN.R-project.org/package=psych . Versão = 1.3.2.
· Rosseel, Y. (2012). lavaan: Um pacote R para modelagem de equações estruturais. Journal of Statistical Software, 48 (2), 1–36. Recuperado em http://www.jstatsoft.org/v48/i02/ .
· Wang, WC, & Cunningham, EG (2005). Comparação de métodos alternativos de estimativa em análises fatoriais confirmatórias do General Health Questionnaire. Relatórios Psicológicos, 97 , 3-10.
· Wirth, RJ, e Edwards, MC (2007). Análise fatorial de item: abordagens atuais e orientações futuras. Métodos psicológicos, 12 , 58-79. Recuperado em http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3162326/ .

Nick Stauner
fonte
(+11) Não sei como eu perdi sua resposta!
chl 14/05
Ha! Obrigado! Este aqui está sentado há um tempo. Supus que fosse um pouco longo ou obscuro, ou talvez dependesse de novos métodos que eram mais controversos do que eu imaginava. Parece que também não sabia como usar tags para nomes de usuário.
Nick Stauner