Recentemente, ajustei 4 modelos de regressão múltiplos para os mesmos dados de previsão / resposta. Dois dos modelos eu me encaixo com a regressão de Poisson.
model.pois <- glm(Response ~ P1 + P2 +...+ P5, family=poisson(), ...)
model.pois.inter <- glm(Response ~ (P1 + P2 +...+ P5)^2, family=poisson(), ...)
Dois dos modelos eu me encaixo com regressão binomial negativa.
library(MASS)
model.nb <- glm.nb(Response ~ P1 + P2 +...+ P5, ...)
model.nb.inter <- glm.nb(Response ~ (P1 + P2 +...+ P5)^2, ...)
Existe um teste estatístico que eu possa usar para comparar esses modelos? Eu tenho usado o AIC como uma medida do ajuste, mas o AFAIK não representa um teste real.
regression
aic
count-data
likelihood-ratio
model-comparison
Daniel Standage
fonte
fonte
model.nb.inter
é significativamente melhor que o demodel.pois.inter
. Sim, a AIC é mais baixa, mas quanto menor é significativamente melhor ?model.pois
model.pois.inter
model.nb
model.nb.inter
Respostas:
Você pode comparar o modelo binomial negativo ao modelo de Poisson correspondente com um teste de razão de verossimilhança. Um modelo de Poisson é equivalente a um modelo binomial negativo com um parâmetro de super-dispersão igual a zero. Portanto, eles são modelos aninhados e as taxas de probabilidade são válidas. A complicação é que o parâmetro de super-dispersão é restrito a não-negativo, ou seja, logicamente não pode ser menor que zero, portanto a hipótese nula está no limite do espaço do parâmetro. Isso significa que, em vez de comparar duas vezes a probabilidade logarítmica a uma distribuição qui-quadrado com um grau de liberdade, você precisa compará-lo a uma distribuição de mistura composta por partes iguais de um qui-quadrado com 1 df e uma massa pontual em zero (uma distribuição qui-quadrado com zero grau de liberdade). O que isso significa na prática é que você pode calcular o valor p usando o qui-quadrado com 1 df e depois reduzi-lo pela metade. Para mais detalhes e informações, consulte o Caso 5 deSelf & Liang JASA 1987; 82 : 605-610. .
Observe que alguns pacotes de software estatístico, como Stata, farão tudo isso automaticamente quando você ajustar um modelo binomial negativo. Na verdade, eu descaradamente desarrumei grande parte do exposto no sistema de ajuda Stata - se você vê o Stata
help j_chibar
.fonte
Eu acredito que
anova()
R pode ser usado para isso. Apesar do nome, é um teste de razão de probabilidade. Crawley em seu livro The R tem alguns exemplos de uso.fonte
Como observa o ponto inicial, como os modelos estão aninhados, é possível executar um teste de razão de verossimilhança.
Em geral, embora isso não seja verdade, por isso, se você quiser comparar modelos não aninhados, poderá usar o teste de Vuong .
fonte