Comparando modelos de regressão em dados de contagem

11

Recentemente, ajustei 4 modelos de regressão múltiplos para os mesmos dados de previsão / resposta. Dois dos modelos eu me encaixo com a regressão de Poisson.

model.pois <- glm(Response ~ P1 + P2 +...+ P5, family=poisson(), ...)
model.pois.inter <- glm(Response ~ (P1 + P2 +...+ P5)^2, family=poisson(), ...)

Dois dos modelos eu me encaixo com regressão binomial negativa.

library(MASS)
model.nb <- glm.nb(Response ~ P1 + P2 +...+ P5, ...)
model.nb.inter <- glm.nb(Response ~ (P1 + P2 +...+ P5)^2, ...)

Existe um teste estatístico que eu possa usar para comparar esses modelos? Eu tenho usado o AIC como uma medida do ajuste, mas o AFAIK não representa um teste real.

Daniel Standage
fonte
Você deseja comparar o ajuste dos modelos usando um teste estatístico, certo? Que tipo de hipótese você gostaria de testar?
Firefeather
@Firefeather Por exemplo, eu gostaria de testar se o ajuste de model.nb.interé significativamente melhor que o de model.pois.inter. Sim, a AIC é mais baixa, mas quanto menor é significativamente melhor ?
Daniel Standage
Nota: a resposta a esta pergunta não precisa realmente incluir o AIC.
Daniel Standage
Fmodel.poismodel.pois.intermodel.nbmodel.nb.interF
1
@Firefeather, sim, eu estou ciente da necessidade de controlar o nível de confiança familiar. Scheffe seria mais apropriado aqui do que, digamos, Bonferroni?
Daniel Standage

Respostas:

14

Você pode comparar o modelo binomial negativo ao modelo de Poisson correspondente com um teste de razão de verossimilhança. Um modelo de Poisson é equivalente a um modelo binomial negativo com um parâmetro de super-dispersão igual a zero. Portanto, eles são modelos aninhados e as taxas de probabilidade são válidas. A complicação é que o parâmetro de super-dispersão é restrito a não-negativo, ou seja, logicamente não pode ser menor que zero, portanto a hipótese nula está no limite do espaço do parâmetro. Isso significa que, em vez de comparar duas vezes a probabilidade logarítmica a uma distribuição qui-quadrado com um grau de liberdade, você precisa compará-lo a uma distribuição de mistura composta por partes iguais de um qui-quadrado com 1 df e uma massa pontual em zero (uma distribuição qui-quadrado com zero grau de liberdade). O que isso significa na prática é que você pode calcular o valor p usando o qui-quadrado com 1 df e depois reduzi-lo pela metade. Para mais detalhes e informações, consulte o Caso 5 deSelf & Liang JASA 1987; 82 : 605-610. .

Observe que alguns pacotes de software estatístico, como Stata, farão tudo isso automaticamente quando você ajustar um modelo binomial negativo. Na verdade, eu descaradamente desarrumei grande parte do exposto no sistema de ajuda Stata - se você vê o Stata help j_chibar.

uma parada
fonte
5

Eu acredito que anova()R pode ser usado para isso. Apesar do nome, é um teste de razão de probabilidade. Crawley em seu livro The R tem alguns exemplos de uso.

Roman Luštrik
fonte
1

Como observa o ponto inicial, como os modelos estão aninhados, é possível executar um teste de razão de verossimilhança.

Em geral, embora isso não seja verdade, por isso, se você quiser comparar modelos não aninhados, poderá usar o teste de Vuong .

Xodarap
fonte