Pressupostos de regressão logística multinomial

10

Quais são as premissas apropriadas da regressão logística multinomial? E quais são os melhores testes para satisfazer essas suposições usando o SPSS 18?

Marca
fonte

Respostas:

6

O principal pressuposto no MNL é que os erros são distribuídos de forma independente e idêntica com uma distribuição de valor extremo da Gumbel. O problema ao testar essa suposição é que ela é feita a priori . Na regressão padrão, você ajusta a curva dos mínimos quadrados e mede o erro residual. Em um modelo de logit, você assume que o erro já está na medição do ponto e calcula uma função de probabilidade a partir dessa suposição.

Uma suposição importante é que a amostra seja exógena. Se for baseado em escolha, há correções que precisam ser empregadas.

Quanto às premissas do próprio modelo, o Train descreve três:

  1. Variação sistemática e não aleatória do sabor.
  2. Substituição proporcional entre alternativas (uma consequência da propriedade do IIA).
  3. Nenhuma correlação serial no termo do erro (dados do painel).

A primeira suposição que você apenas precisa defender no contexto do seu problema. O terceiro é basicamente o mesmo, porque os termos do erro são puramente aleatórios.

λ=1 1λ=1 1

Quanto a fazer isso no SPSS, não posso ajudá-lo a não ser sugerir que você use o mlogitpacote no R. Desculpa.

gregmacfarlane
fonte
Além disso, o modelo probit multinomial fornece resultados comparáveis ​​com um conjunto diferente de suposições. Portanto, uma comparação MNP / MNL também pode ser valiosa.
gregmacfarlane
3

Y

Frank Harrell
fonte
Acontece que isso nem sempre é completamente verdade. Houve algum trabalho (muito) recente mostrando que parâmetros consistentes podem ser estimados para alternativas que você nunca observa, desde que você tenha alguma informação exógena sobre qual é a frequência atual da população. Mas isso requer um estimador diferente, portanto, em geral, você está correto.
Gregmacfarlane
11
Parece que um prior bayesiano está sendo chamado - não posso discordar. Mas, sem informações externas, a logística multinomial irrestrita tem muitos parâmetros para estimar.
precisa
2

O gmacfarlane tem sido muito claro. Mas, para ser mais preciso, e suponho que você faça uma análise de seção transversal, a suposição principal é o IIA (independência de alternativas irrelevantes). Você não pode forçar seus dados a se ajustarem à premissa do IIA, deve testá-los e esperar que sejam satisfeitos. Os Spss não conseguiram lidar com o teste até 2010, com certeza. R, é claro, mas é mais fácil migrar para o estado e implementar os testes IIA fornecidos pelos comandos de pós-estimativa do mlogit.

Se o IIA não for válido, logit multinomial misto ou logit aninhado são alternativas razoáveis. O primeiro pode ser estimado dentro do gllamm, o segundo com o comando nlogit muito mais parcimonioso.

JDav
fonte