Fatores de pontuação a partir de respostas ordinais discretas

12

Existe uma maneira básica de estimar as pontuações dos fatores quando você possui variáveis ​​ordinais e discretas.

Eu tenho variáveis ​​ordinais, discretas. Se eu assumir que subjacente a cada resposta é uma variável contínua, normalmente distribuída, então posso calcular uma matriz de correlação policórica . Posso então executar uma análise fatorial nessa matriz e obter cargas fatoriais para cada variável.n × nnn×n

Como posso combinar as cargas fatoriais e as variáveis ​​para estimar as pontuações dos fatores. As formas típicas de estimar pontuações parecem exigir que eu trate os dados ordinais como intervalo.

Suponho que eu precise cavar mais fundo nas entranhas da correlação policórica para descobrir uma função de link.

fgregg
fonte

Respostas:

8

A abordagem "baseada em princípios" (ou seja, a abordagem defensável a priori que pode não fazer muita diferença empiricamente) é usar um modelo de resposta graduada , um membro bastante útil da família IRT frequentemente usado para itens do tipo Likert. O pacote R ltm torna isso muito simples.

Você está assumindo que existe uma relação de regressão logística ordinal entre a característica não observada e cada um dos seus indicadores. A escolha dessa classe de modelo permite levar a sério a natureza ordinal dos indicadores e fornece informações sobre a parte da característica em que cada item é mais informativo. Como a análise fatorial, ele fornece um erro padrão para a pontuação, embora as pessoas da FA pareçam ignorá-las por algum motivo.

Por outro lado, a escolha dessa classe de modelo limita sua capacidade de executar todas as coisas clássicas da análise fatorial, como rotacionar as coisas até que você goste da aparência delas. Eu acho que isso é uma vantagem, mas pessoas razoáveis ​​discordam. Se você está fazendo esse tipo de coisa para descobrir quantas 'escalas' você tem, é melhor observar os procedimentos de Mokken que tentam identificar escalas, já que a FA 'se encaixa em outra dimensão e gira para uma estrutura simples' ganha. funcione.

conjugado
fonte
+1, mas qual seria a justificativa para considerar uma rotação quando o GRM realmente assume uma escala unidimensional?
chl
@chl O pensamento era que algumas pessoas alternavam para uma estrutura simples para poder dizer coisas como 'indicadores 1-4 medem uma coisa e indicadores 5-11 medem outra coisa' com base nas cargas rotacionadas. O pensamento relacionado, mas não muito idêntico, à abordagem da TRI seria dizer coisas como: 'esse procedimento de Mokken me diz que há uma escala subjacente aos indicadores 1-4 e outra abaixo dos 5-11, então aplicarei meu modelo de resposta graduada a cada subconjunto separadamente '. Espero que faça mais sentido.
conjugateprior
Sim, de fato. Obrigado por esclarecer o que extrapolou da sua última frase. Ainda assim, não temos como vincular cada característica latente se ela estiver realmente correlacionada (a menos que esteja olhando para o MIRT).
chl
8

É comum extrair pontuações fatoriais de indicadores de variáveis ​​ordinais. Pesquisadores que usam medidas likert fazem isso o tempo todo. Como as pontuações dos fatores são baseadas na covariância, geralmente não é tão grande assim que os "intervalos" possam não ser uniformes dentro e entre os itens, principalmente se os itens forem comparáveis ​​e usarem escalas razoavelmente compactas (por exemplo, 5 ou 7 pontos) / discordo "itens likert): todos os sujeitos estão respondendo aos mesmos itens e, se os itens são realmente medidas válidas de alguma variável latente, as respostas devem exibir um padrão de covariância uniforme. Ver Gorsuch, RL (1983). Análise fatorial. Hillsdale, NJ: Lawrence Erlbaum. 2nd. ed., pp. 119-20. Mas se incomoda você assumir que as respostas para suas variáveis ​​ordinais são lineares - ou ainda mais importantes, se você deseja pontuações fatoriais que não são lineares, mas refletem associações não lineares recorrentes entre itens categóricos (como faria se suas variáveis ​​fossem nominais ou qualitativas) - você deve usar uma alternativa de escala não linear à análise fatorial convencional, como classe latente análise ou teoria de resposta ao item. (É claro que há uma semelhança familiar entre essa consulta e a sua consulta sobre o uso de preditores ordinais em modelos de regressão de logit; talvez eu possa mais uma vez inspirar chi ou alguém que sabe mais do que eu para nos levar a uma conta ainda mais refinada por que você não precisa se preocupar - ou talvez por que deveria.) t linear, mas reflete associações não lineares recorrentes entre itens categóricos (como você faria se suas variáveis ​​fossem nominais ou qualitativas) - você deve usar uma alternativa de escala não linear à análise fatorial convencional, como análise de classe latente ou teoria de resposta a itens. (É claro que há uma semelhança familiar entre essa consulta e a sua consulta sobre o uso de preditores ordinais em modelos de regressão de logit; talvez eu possa mais uma vez inspirar chi ou outra pessoa que sabe mais do que eu para nos levar a uma conta ainda mais refinada por que você não precisa se preocupar - ou talvez por que deveria.) t linear, mas reflete associações não lineares recorrentes entre itens categóricos (como você faria se suas variáveis ​​fossem nominais ou qualitativas) - você deve usar uma alternativa de escala não linear à análise fatorial convencional, como análise de classe latente ou teoria de resposta a itens. (É claro que há uma semelhança familiar entre essa consulta e a sua consulta sobre o uso de preditores ordinais em modelos de regressão de logit; talvez eu possa mais uma vez inspirar chi ou outra pessoa que sabe mais do que eu para nos levar a uma conta ainda mais refinada por que você não precisa se preocupar - ou talvez por que deveria.)

dmk38
fonte
4

Posso apenas esclarecer algo aqui, por favor, você tem itens pontuados em diferentes escalas que você precisa pré-processar e combinar (intervalo, ordinal, nominal), ou você está procurando fazer uma análise fatorial em apenas variáveis ​​da escala ordinal?

Se for o último - aqui está uma abordagem.

http://cran.r-project.org/web/packages/Zelig/vignettes/factor.ord.pdf

(observe que este link está morto). Existem outras vinhetas , mas não esta.

user2238
fonte
1
Aqui está uma versão espelhada da vinheta original, caso isso ajude: bit.ly/x6eI4x .
chl
Esse código não parece ser implementado
fgregg