Teoria da resposta ao item vs análise fatorial confirmatória

14

Fiquei imaginando quais são as principais diferenças significativas entre a Teoria da resposta ao item e a Análise fatorial confirmatória.

Entendo que existem diferenças nos cálculos (focando mais no item vs. covariâncias; log-linear vs. linear).

No entanto, não tenho idéia do que isso significa de uma perspectiva de nível superior - isso significa que a TRI é melhor que a CFA em algumas circunstâncias? Ou para fins finais ligeiramente diferentes?

Qualquer reflexão seria útil, pois uma varredura da literatura de pesquisa levou a mais uma descrição da TRI e CFA do que qualquer comparação útil das principais diferenças entre elas.

SimonsSchus
fonte

Respostas:

7

A resposta do @ Philchalmers está no ponto, e se você quiser uma referência de um dos líderes no campo, Muthen (criador do Mplus), aqui está: (Editado para incluir cotação direta)

Um usuário do MPlus pergunta: Estou tentando descrever e ilustrar semelhanças e diferenças atuais entre CFA e IRT binários para minha tese. O método de estimativa padrão no Mplus para CFA categórico é WLSMV. Para executar um modelo de TRI, o exemplo no seu manual sugere usar a MLR como o método de estimativa. Quando uso MLR, a entrada de dados ainda é a matriz de correlação tetracórica ou a matriz de dados de resposta original é usada?

Bengt Muthen responde: Não acho que exista uma diferença entre o CFA das variáveis ​​categóricas e a TRI. Às vezes é reivindicado, mas eu não concordo. Qual estimador é normalmente usado pode diferir, mas isso não é essencial. A MLR usa os dados brutos, não uma matriz de correlação tetracórica de amostra. ... A abordagem ML (R) é a mesma que a abordagem "marginal ML (MML)" descrita no trabalho de Bock, por exemplo. Então, usando os dados brutos e integrando os fatores usando a integração numérica. MML sendo contrastado com "ML condicional" usado, por exemplo, com abordagens Rasch.

Assumindo fatores normais, relações item-fator probit (ogiva normal) e independência condicional, os pressupostos são os mesmos para ML e para WLSMV, onde o último usa tetracórica. Isso ocorre porque essas suposições correspondem à suposição de variáveis ​​de resposta latente contínua subjacentes normais multivariadas por trás dos resultados categóricos. Portanto, o WLSMV usa apenas informações de 1ª e 2ª ordem, enquanto o ML vai até a ordem mais alta. A perda de informações parece pequena, no entanto. O ML não se encaixa no modelo dessas amostras tetracóricas, portanto, talvez se possa dizer que o WLSMV marginaliza de uma maneira diferente. É uma questão de diferenças no estimador, e não no modelo.

Temos uma nota de IRT em nosso site:

http://www.statmodel.com/download/MplusIRT2.pdf

mas, novamente, a abordagem ML (R) não é nada diferente do que é usado no IRT MML.

Fonte: http://www.statmodel.com/discussion/messages/9/10401.html?1347474605

robin.datadrivers
fonte
2
Você poderia copiar e colar algumas citações relevantes de Muthen na sua resposta? As respostas somente para links geralmente são mal vistas, principalmente porque os links tendem a apodrecer.
ameba diz Restabelecer Monica
2
Não sei se concordo com a declaração de Muthen aqui, pois ele parece estar definindo a TRI de uma maneira muito estreita. Sim, o 2PL e os modelos de resposta graduada podem ser entendidos em uma estrutura SEM porque eles têm boas funções de ligação canônica e, portanto, podem ser reprimidos usando outras estatísticas suficientes (como correlações policóricas). Mas e os outros modelos mais comuns de TRI, como o modelo 3PL, o modelo de ponto ideal, o modelo parcialmente compensatório etc.? Certamente, alguns modelos podem ser entendidos em uma estrutura SEM, mas acho que meu argumento sobre IRT ainda permanece.
philchalmers
17

De certa forma, você tem razão, CFA e IRT são cortados do mesmo tecido. Mas de muitas maneiras elas também são bem diferentes. O CFA, ou, mais apropriadamente, o item CFA, é uma adaptação da estrutura de modelagem de equações / covariâncias estruturais para explicar um tipo específico de covariação entre itens categóricos. O IRT é mais diretamente sobre a modelagem de relacionamentos de variáveis ​​categóricas sem usar apenas informações de primeira e segunda ordem nas variáveis ​​(são informações completas, portanto, seus requisitos geralmente não são tão rigorosos).

O item CFA possui vários benefícios, pois se enquadra na estrutura do SEM e, portanto, tem uma aplicação muito ampla para sistemas multivariados de relacionamentos com outras variáveis. A TRI, por outro lado, concentra-se principalmente no próprio teste, embora as covariáveis ​​também possam ser incluídas diretamente no teste (por exemplo, consulte os tópicos sobre TRI explicativa). Também descobri que os relacionamentos de modelagem de itens são muito mais gerais na estrutura do IRT, pois modelos de resposta de itens não monotônicos, não paramétricos ou simplesmente customizados são mais fáceis de lidar, porque não é necessário se preocupar com a suficiência. de usar a matriz de correlação policórica.

Ambas as estruturas têm seus prós e contras, mas, em geral, a CFA é mais flexível quando o nível de abstração / inferência de modelagem é focado no relacionamento dentro de um sistema de variáveis, enquanto a TRI é geralmente preferida se o teste em si (e seus itens) forem o foco de interesse.

filósofos
fonte
Maravilhoso - esta é uma visão adorável e clara. Obrigado Phil.
SimonsSchus
2
Essa deve ser a resposta aceita.
Vladislavs Dovgalecs
2

Acredito que Yves Rosseel discute brevemente nos slides 91-93 de seu workshop de 2014: http://www.personality-project.org/r/tutorials/summerschool.14/rosseel_sem_cat.pdf

Retirado de Rosseel (2014, link acima):

Abordagem de informação completa: verossimilhança máxima marginal

origens: modelos de TRI (por exemplo, Bock & Lieberman, 1970) e GLMMs

...

a conexão com o IRT

• a relação teórica entre SEM e IRT foi bem documentada:

Takane, Y., & De Leeuw, J. (1987). Sobre a relação entre teoria da resposta ao item e análise fatorial de variáveis ​​discretizadas. Psychome- trika, 52, 393-408.

Kamata, A. e Bauer, DJ (2008). Uma observação sobre a relação entre os modelos de teoria analítica de fatores e teoria de resposta a itens. Modelagem de Equações Estruturais, 15, 136-153.

Joreskog, KG; Moustaki, I. (2001). Análise fatorial de variáveis ​​ordinais: Uma comparação de três abordagens. Pesquisa Comportamental Multivariada, 36, 347-387.

quando eles são equivalentes?

• probit (normal-ogive) versus logit: ambas as métricas são usadas na prática

• um CFA de fator único em itens binários é equivalente a um modelo de TRIT de 2 parâmetros (Birnbaum, 1968):

No CFA: ... No IRT: ... (consulte o slide)

• um CFA de fator único em itens policotômicos (ordinais) é equivalente ao modelo de resposta graduada (Samejima, 1969)

• não há CFA equivalente para o modelo de 3 parâmetros (com um parâmetro de estimativa)

• o modelo Rasch é equivalente a um CFA de fator único em itens binários, mas onde todas as cargas de fator são restritas a serem iguais (e a métrica probit é convertida em métrica logit)

Pier-Eric Chamberland
fonte