Contexto
Eu tenho lido sobre a teoria da resposta ao item e acho fascinante. Acredito que compreendo o básico, mas fiquei me perguntando como aplicar técnicas estatísticas relacionadas à área. Abaixo estão dois artigos semelhantes à área em que gostaria de aplicar o ITR:
O segundo é o que eu realmente gostaria de estender neste momento.
Eu baixei um programa gratuito chamado jMetrik e parece estar funcionando muito bem. Eu acho que pode ser muito básico no que diz respeito à TRI, mas não tenho certeza.
Eu sei que o "melhor" caminho provavelmente envolveria aprender R; no entanto, não sei se posso poupar tempo para enfrentar essa curva de aprendizado. Observe que temos algum financiamento para a compra de software, mas pelo que vejo, parece não haver grandes programas de IRT por aí.
Questões
- Quais são seus pensamentos sobre a eficácia do jMetrik?
- Como você sugere que eu avance na aplicação da TRI?
- Quais são os melhores programas para aplicar o IRT?
- Algum de vocês usa IRT regularmente? Se sim, como?
fonte
Respostas:
Como um bom iniciador para a TRI, eu sempre recomendo a leitura de um guia visual para a teoria da resposta ao item .
Uma pesquisa sobre o software disponível pode ser encontrada em www.rasch.org .
Pela minha experiência, achei os comandos Stata Raschtest (e associados) muito úteis na maioria dos casos em que alguém está interessado em ajustar o modelo de um parâmetro. Para um design mais complexo, pode-se recorrer ao GLLAMM ; há um bom exemplo de trabalho baseado no livro de De Boeck e Wilson, Item Explicativo e Modelos de Resposta (Springer, 2004).
Sobre o R especificamente, existem muitos pacotes que foram disponibilizados nos últimos cinco anos, veja, por exemplo, a Visão de Tarefa CRAN relacionada . A maioria deles é discutida em uma edição especial do Journal of Statistical Software (vol. 20, 2007). Conforme discutido em outra resposta, o ltm e o eRm permitem ajustar uma ampla variedade de modelos de TRI. Como eles se baseiam em diferentes métodos de estimativa -
ltm
usaram a abordagem marginal enquantoeRm
usavam a abordagem condicional - a escolha de uma ou de outra é principalmente uma questão do modelo que você deseja ajustar (eRm
não se encaixa nos modelos de 2 ou 3 parâmetros) e no objetivo de medição que você segue: a estimativa condicional dos parâmetros pessoais possui algumas boas propriedades psicométricas, enquanto uma abordagem marginal permite alternar facilmente para o modelo de efeitos mistos, conforme discutido nos dois artigos a seguir. :Existem também algumas possibilidades para ajustar modelos Rasch usando métodos MCMC, consulte, por exemplo, o pacote MCMCpack (ou WinBUGS / JAGS , mas consulte o Código de BUGS para a Teoria da Resposta ao Item , JSS (2010) 36).
Não tenho experiência com SAS para modelagem de IRT, portanto, deixarei isso para alguém que seja mais versado em programação SAS.
Outros softwares dedicados (usados principalmente na avaliação educacional) incluem: RUMM, Conquest, Winsteps, BILOG / MULTILOG, Mplus (sem citar a lista já disponível na wikipedia ). Nenhum é de uso gratuito, mas a versão de demonstração com tempo limitado é proposta para alguns deles. Eu achei o jMetrik muito limitado quando tentei (um ano atrás) e todas as funcionalidades já estão disponíveis no R. Da mesma forma, o ConstructMap pode ser substituído com segurança pelo lme4 , conforme ilustrado no folheto acima. Também devo mencionar
mdltm
(Modelos multidimensionais discretos de características latentes) para modelos mistos de Rasch, de von Davier e Coll., Que devem acompanhar o livroModelos Rasch de distribuição multivariada e de mistura (Springer, 2007).fonte
ex5.5
Para a primeira pergunta, não tenho nenhuma informação sobre o jMetrick.
Ao aplicar a TRI, (como em qualquer outro procedimento estatístico), o primeiro passo é usá-lo com o maior número possível de dados. Existe uma curva de aprendizado, mas acredito que vale a pena.
Uma característica importante da TRI é a diferenciação entre os modelos Rasch e os modelos IRT. Eles foram desenvolvidos por pessoas diferentes para diferentes fins. Dito isto, os modelos de TRI são um superconjunto de modelos Rasch.
Os modelos Rasch são modelos de um parâmetro - eles assumem que todos os itens de um questionário são igualmente preditivos da característica latente.
Os modelos de TRI, no entanto, são dois modelos de parâmetros que permitem que as perguntas sejam diferentes em sua capacidade de fornecer informações sobre a capacidade dos participantes.
Além disso, existem três modelos de parâmetros que são semelhantes aos modelos de TRI, exceto que eles permitem que um parâmetro de adivinhação explique a capacidade dos participantes de obter a resposta certa por acaso (isso é mais uma preocupação de habilidade do que de testes de personalidade).
Além disso, existe uma TRI multidimensional que estima várias habilidades latentes de uma só vez. Não sei muito sobre isso, mas é uma área que pretendo aprender mais.
Há também uma distinção entre métodos dicotômicos e politômicos de TRI. Modelos dicotômicos de TRI são aqueles usados em testes de habilidade, que têm uma resposta certa e errada. Modelos de IRT politômicos são usados em testes de personalidade, onde existem várias respostas, igualmente corretas (no sentido de que não há resposta correta).
Eu pessoalmente uso R para a teoria da resposta ao item. Existem dois pacotes principais que eu usei,
eRm
que se encaixam apenas nos modelos Rasch eltm
que se encaixam nos modelos da teoria de resposta ao item (modelos de dois e três parâmetros). Ambos possuem funcionalidade semelhante e fornecem mais rotinas para modelos dicotômicos de TRI. Não sei se R é o "melhor" para IRT, ele não possui toda a variedade de modelos de IRT disponíveis, mas é certamente o mais extensível, pois é possível programar esses modelos com relativa facilidade.Uso o IRT quase que exclusivamente para modelos politômicos, em R. Normalmente começo com métodos não paramétricos do IRT (fornecidos no pacote
mokken
) para testar as suposições e, em seguida, prossigo com um modelo rasch, adicionando mais complexidade conforme necessário para obter um bom ajuste.Para o IRT multidimensional, existe o pacote `mirt ', que fornece essa funcionalidade. Eu não o usei, então não posso realmente comentar.
Se você instalar esses pacotes no R e chamar a função 'vignette ("packagename")' ', deverá obter algumas vinhetas úteis (definitivamente para
eRm
emokken
possivelmente outras) que podem ser úteis para você (dependendo do seu nível de sofisticação matemática).Finalmente, há vários bons livros disponíveis para os modelos rasch e irt. A teoria da resposta ao item para psicólogos é frequentemente usada (embora eu não goste do estilo) e, além da cadeia de sofisticação técnica, existem dois livros didáticos extremamente abrangentes e úteis - o Manual da Teoria Moderna da Resposta ao Item e os modelos Rasch: fundações recentes Desenvolvimentos e aplicações .
Eu espero que isso ajude.
fonte
O jMetrik é mais poderoso do que você imagina. Ele foi projetado para o trabalho operacional em que os pesquisadores precisam de vários procedimentos em uma única estrutura unificada. Atualmente, você pode estimar parâmetros de TRI para os modelos Rasch, crédito parcial e escala de classificação. Também permite a ligação da escala do IRT através do Stocking-Lord, Haebara e outros métodos. Por incluir um banco de dados integrado, a saída da estimativa do IRT pode ser usada em links de escala sem a necessidade de remodelar os arquivos de dados. Além disso, toda saída pode ser armazenada no banco de dados para uso com outros métodos no jMetrik ou em programas externos como o R.
Você também pode executá-lo com scripts em vez da GUI. Por exemplo, o código a seguir irá (a) importar dados para o banco de dados, (b) pontuar itens com uma chave de resposta, (c) estimar os parâmetros do modelo Rasch e (d) exportar dados como um arquivo CSV. Você pode usar o arquivo de saída final como entrada no R para análises adicionais, ou pode usar o R para conectar-se diretamente ao banco de dados jMetrik e trabalhar com os resultados.
O software ainda está em seus estágios iniciais de desenvolvimento. Atualmente, estou adicionando análise fatorial exploratória e modelos mais avançados de resposta a itens. Ao contrário de muitos outros programas de IRT, o jMetrik é de código aberto. todos os procedimentos de medição usam a biblioteca psicométrica atualmente disponível no GitHub, https://github.com/meyerjp3/psychometrics . Qualquer pessoa interessada em contribuir é bem-vinda.
fonte
Você tem uma lista bastante ampla de perguntas aqui, mas bastante relevante para muitos pesquisadores!
Eu recomendo que você avance no IRT, mas somente se sua situação atender aos requisitos. Por exemplo, ele se adapta bem aos tipos de testes que você usa e provavelmente o mais importante é que você tenha os tamanhos de amostra necessários. Para dados dicotômicos de múltipla escolha, recomendo o modelo 3PL (o argumento Rasch de "medição objetiva" é surpreendentemente desinteressante) e 500-1000 é geralmente o tamanho mínimo da amostra. Dados dicotômicos sem adivinhação, como pesquisas psicológicas que têm respostas Y / N a declarações, funcionam bem com o 2PL. Se você possui escala de classificação ou dados parciais de crédito, existem modelos politômicos projetados especificamente para essas situações.
IMHO, o melhor programa para aplicar o IRT é o Xcalibre. É relativamente fácil de usar (GUI simples, bem como algum tipo de lote de linha de comando, se você quiser por algum motivo) e produz uma saída altamente legível (o MS Word reporta com tabelas e figuras extensas). Eu recomendo não usar R pelas razões opostas. A desvantagem, é claro, é que não é gratuito, mas você tende a receber o que paga como dizem. Descrição completa, exemplo de saída e uma avaliação gratuita estão disponíveis em www.assess.com .
fonte
Nesse meio tempo, publicou um novo livro de Frank Baker, Baker Frank B., Seock-Ho Kim. Noções básicas da teoria da resposta ao item usando R. Springer International Publishing (2017) . Ele não utiliza pacotes R, mas oferece trechos.
Uma lista (cheia) de pacotes R para IRT com descrição sucinta está disponível no CRAN .
fonte