Semelhanças e diferenças entre o modelo de TRI e o modelo de regressão logística

9

Apesar das semelhanças básicas como os dois modelos, a probabilidade de sucesso, em vez de modelar diretamente a variável resposta; Acredito que existem respostas mais confiáveis ​​que apontam as diferenças e semelhanças entre esses modelos.

Uma diferença é que, na logística, pode-se usar diferentes tipos e diferentes números de variáveis ​​independentes; enquanto no modelo da TRI apenas temos apenas uma variável independente que é a capacidade.

Mais uma semelhança: para estimar os parâmetros em logística, usamos a abordagem de máxima verossimilhança. Na TRI também usamos a probabilidade máxima marginal como uma das abordagens de estimativa de parâmetros.

Então, alguém pode indicar as diferenças estatísticas / matemáticas nesses dois modelos?

Artiga
fonte
1
A TRI (também conhecida como análise de características latentes) às vezes é chamada de análise fatorial logística ( consulte ). A diferença entre LR e IRT é paralela à diferença entre regressão linear e análise fatorial. Na regressão, a variável dependente é fornecida, juntamente com as variáveis ​​independentes do manifesto. Na análise fatorial e em outros modelos de variáveis ​​latentes, o latente é extraído das variáveis ​​manifestas fornecidas; além disso, é o latente que então é visto como a variável independente que "prediz" as manifestas.
ttnphns
@ttnphns, muito obrigado pela resposta. Portanto, estou cometendo um erro se estiver referindo uma variável Y como resposta a um item e depois modelando a probabilidade de que ela esteja correta. Nesse cenário, eu já não conhecia minha variável dependente? E mais uma pergunta, variável manifesta, você quer dizer dependente na TRI, certo?
Art
Repetir. Em uma regressão, você tem DVs manifestos Y e IVs manifestos X. Em modelos de variáveis ​​latentes (análise fatorial, TRI, ...) Você tem apenas X. Os fatores latentes F são extraídos de X, mas extraídos para considerá-los como preditores de X, ou seja, eles servem os IVs para X, que são os DVs. Na regressão logística, a DV categórica é uma função logística da combinação linear de IVs (geralmente contínuos). Na TRI, as variáveis ​​categóricas observadas são função logística da combinação linear de Fs contínuos.
ttnphns

Respostas:

11

Dê uma olhada na Seção 1.6 ("A perspectiva da regressão linear") em De Boeck e Wilson (2008), Modelos de resposta a itens explicativos ( http://www.springer.com/de/book/9780387402758 ) e Formann, AK (2007). , (Quase) Equivalência entre estimativas de máxima verossimilhança condicional e de mistura para alguns modelos do tipo Rasch. Em M. von Davier e CH Carstensen (Eds.), Modelos Rasch multivariados e de distribuição de mistura (pp. 177-189), Nova York: Springer.

Em resumo: os modelos de TRI são modelos de efeitos mistos não lineares generalizados :

  • a pontuação de um aluno p em um item i é a variável dependente,YpEu{0 0,1}pEu
  • dada a característica de um aluno amostrado aleatoriamente, por exemplo, , as respostas são assumidas como independentes, distribuídas por Bernoulli,θpN(μ,σ2)
  • dado , o preditor η p i = logit ( P ( Y p i = 1 ) ) é uma combinação linear de características do item η p i = K k = 0 b k X i k + θ p + ε p i ,θpηpEu=logit(P(YpEu=1))
    ηpEu=k=0 0KbkXEuk+θp+εpEu,
  • deixar se i = k , e X i k = 0 , caso contrário - assim se obter o modelo Rasch P ( Y p i = 1 | θ p ) = exp ( θ p - b i )XEuk=-1,Eu=kXEuk=0 0
    P(YpEu=1θp)=exp(θp-bEu)1+exp(θp-bEu);

Observe que os modelos de TRI são estendidos para diferentes aspectos:

  • No que diz respeito ao poder discriminatório (2PL) e proporção supondo (3PL) de um produto
    P(YpEu=1θp)=cEu+(1-cEu)exp(umaEu(θp-bEu))1+exp(umaEu(θp-bEu))
  • P(YpEu=kθp)=exp(umaEukθp-bEuk)k=0 0Kexp(umaEukθp-bEuk)
  • θpN(Zβ,σ2),
  • P(YpEu=1θp)=exp(dumaEudθpd-bEu)1+exp(dumaEudθpd-bEu),θpNd(μ,Σ)
  • P(YpEu=1θp(eu))=exp(θp(eu)-bEu(eu))1+exp(θp(eu)-bEu(eu)),θp(eu){θp(1),,θp(eu)}

(retirado dos slides useR! 2015 para o pacote R TAM )

Tom
fonte
3
Também há artigos disponíveis gratuitamente por de Boeck et al neste jstatsoft.org/article/view/v039i12, além de seu folheto statmath.wu.ac.at/courses/deboeck/materials/handouts.pdf
Tim
0

A resposta de @ Tom é excelente, mas eu gostaria de oferecer uma versão mais heurística e que introduz um conceito adicional.

Regressão logística

Imagine que temos várias perguntas binárias. Se estivermos interessados ​​na probabilidade de responder sim a qualquer uma das perguntas e se estivermos interessados ​​no efeito de algumas variáveis ​​independentes nessa probabilidade, usamos a regressão logística:

P(yEu=1)=11+exp(Xβ)=euogEut-1(Xβ)

β

IRT

Agora, observe que eu disse que tínhamos várias perguntas binárias. Todas essas perguntas podem ter algum tipo de característica latente, por exemplo, habilidade verbal, nível de depressão, nível de extroversão. Frequentemente, estamos interessados ​​no nível da característica latente em si.

βθθ

P(yEu=1)=euogEut-1[umaEu(θj-bEu)]

umaEubEu

θ

Usei itens binários e regressão logística para simplificar, mas a abordagem generaliza para itens ordenados e regressão logística ordenada.

IRT explicativa

β

Como mencionado anteriormente, um modelo para estimar a característica latente é apenas contar o número de respostas corretas ou somar todos os valores de seus itens do Likert (ou seja, categóricos). Isso tem suas falhas; você está assumindo que cada item (ou cada nível de cada item) vale a mesma quantidade da característica latente. Essa abordagem é bastante comum em muitos campos.

Talvez você possa ver para onde estou indo com isso: você pode usar a TRI para prever o nível da característica latente e, em seguida, realizar uma regressão linear regular. Isso ignoraria a incerteza no traço latente de cada pessoa.

θθ

Mais leitura disponível na excelente introdução de Phil Chalmers ao seu mirtpacote. Se você entende as porcas e parafusos do IRT, eu iria para a seção IRT de efeitos mistos desses slides . O Stata também é capaz de ajustar modelos explicativos de TRI (embora eu acredite que não possa caber em modelos aleatórios de IRT explicativos, como descrevi acima).

Weiwen Ng
fonte