Usando um conjunto de regressões logísticas binárias com variável de resposta categórica de múltipla escolha

8

Tenho dados de pesquisas categóricas sobre as atitudes das pessoas em relação a uma determinada área política de 13 países. A variável de resposta é categórica e inclui 4 respostas distintas que não podem ser solicitadas.

Eu gostaria de construir um modelo multinomial de múltiplos níveis de interceptação aleatória e inclinação aleatória. O problema é que o número de casos de nível 2 é apenas 13 e o modelo não converge, pelo menos não em sua forma multinomial.

Portanto, como segunda opção, estou pensando em recodificar a variável de resposta em um formato binário, executar uma série de regressões logísticas multiníveis e usar probabilidades previstas para mostrar como depende a probabilidade de que uma determinada categoria de interesse seja selecionada. nas minhas variáveis ​​explicativas. Aparentemente, essa é apenas a segunda melhor opção. Gostaria de saber quais são os possíveis riscos de adotar essa abordagem e quais objeções (de revisores, supervisores etc.) devo esperar.

Stefan Domonkos
fonte
1
Sob qual software / algoritmo seu modelo não está convergindo?
probabilityislogic

Respostas:

2

A escolha entre um multinomial e uma série de regressões logísticas é, na maioria dos casos, relativamente artificial. Como nas duas abordagens você seleciona uma categoria de linha de base (referência) com relação à qual as taxas de chances de todas as outras categorias são expressas, geralmente não importa se você tem uma ou a outra se a categoria de referência permanecer igual. A maior desvantagem é que você não pode testar restrições simultâneas de parâmetros nos modelos logísticos, o que é bastante direto no caso multinomial.

No entanto, aconselho a não usar efeitos aleatórios com 13 países (unidades de nível 2), consulte, por exemplo, https://www.statmodel.com/download/SRM2012.pdf .

A alternativa é usar um modelo de efeitos fixos, no qual você inclui um manequim por país (menos 1). A maior desvantagem dessa previsão de que testar os efeitos no nível macro não é viável. se você não tem nenhuma hipótese a esse respeito, eu usaria o modelo multinomial de efeitos fixos.

tomka
fonte
0

Gostaria de encorajá-lo a executar essa análise em um modelo (no AMOS) e não acho que sua estrutura de dados seja problemática (veja, por exemplo: Maas, CJM & Hox, JJ (2005) Tamanhos de amostra suficientes para modelagem multinível. 86-92.). Ao executar vários modelos no mesmo conjunto de dados, você aumenta a chance de cometer erros do tipo I (no mínimo, você precisará empregar a correção de Bonferroni; que é considerada uma técnica conservadora).

STAToSphere
fonte
1
Sua afirmação de que um modelo de efeitos aleatórios não é problemático com apenas 13 unidades de nível superior (neste caso, países) não é compartilhada por todos. Veja, por exemplo, este estudo de simulação: iser.essex.ac.uk/publications/working-papers/iser/2013-14
Maarten Buis
Eu concordo, leio e ouço que um deve ter de 20 a 30 unidades, veja, por exemplo, Hox et al: statmodel.com/download/SRM2012.pdf
tomka