Estou realmente impressionado com o fato de o Poisson GLM aceitar números não inteiros! Veja:
Dados (conteúdo de data.txt
):
1 2001 0.25 1
1 2002 0.5 1
1 2003 1 1
2 2001 0.25 1
2 2002 0.5 1
2 2003 1 1
Script R:
t <- read.table("data.txt")
names(t) <- c('site', 'year', 'count', 'weight')
tm <- glm(count ~ 0 + as.factor(site) + as.factor(year), data = t,
family = "quasipoisson") # also works with family="poisson"
years <- 2001:2003
plot(years, exp(c(0, tail(coef(tm), length(years)-1))), type = "l")
O índice do ano resultante é o "esperado", ou seja, 1-2-4
em anos 2001-2003
.
Mas como é possível que o Poisson GLM pegue números não inteiros? A distribuição Poisson sempre foi somente número inteiro!
family="poisson"
, mas observe que seu exemplo não é um Poisson GLM, pois você está usando aquasipoisson
família, o que depende apenas da relação entre a média e a variância de qualquer maneira. Nesse caso, não deve haver surpresa em obter números não inteiros.Respostas:
Claro que você está certo de que a distribuição de Poisson tecnicamente é definida apenas para números inteiros. No entanto, a modelagem estatística é a arte de boas aproximações (" todos os modelos estão errados ") e há momentos em que faz sentido tratar dados não inteiros como se fossem [aproximadamente] Poisson.
Por exemplo, se você enviar dois observadores para registrar os mesmos dados de contagem, pode acontecer que os dois nem sempre concordem com a contagem - pode-se dizer que algo aconteceu três vezes enquanto o outro disse que aconteceu quatro vezes. É bom ter a opção de usar 3.5 ao ajustar seus coeficientes de Poisson, em vez de escolher entre 3 e 4.
Computacionalmente, o fatorial no Poisson pode dificultar o trabalho com não-inteiros, mas existe uma generalização contínua do fatorial. Além disso, a realização da estimativa de máxima verossimilhança para o Poisson nem mesmo envolve a função fatorial, uma vez que você simplifica a expressão .
fonte
Para uma resposta , se você assumir que o logaritmo de sua expectativa é uma combinação linear de preditores x E Y i = exp β T x i e sua variação é igual à sua expectativa Var Y i = E Y i , estimativas consistentes para a regressão os coeficientes β podem ser obtidos através da resolução das equações de pontuação para o modelo de Poisson: n ∑ i x i ( y i - exp β T x i ) = 0y x
Isso se segue da abordagem do método dos momentos que aprendemos na escola e leva à de equações de estimativa generalizada .
@ Aaron apontou que você está realmente usando um ajuste quase-Poisson no seu código. Isso significa que a variação é proporcional à média
fonte