Eu tenho esses dados:
set.seed(1)
predictor <- rnorm(20)
set.seed(1)
counts <- c(sample(1:1000, 20))
df <- data.frame(counts, predictor)
Fiz uma regressão de Poisson
poisson_counts <- glm(counts ~ predictor, data = df, family = "poisson")
E uma regressão binomial negativa:
require(MASS)
nb_counts <- glm.nb(counts ~ predictor, data = df)
Então eu calculei para estatísticas de dispersão para a regressão de poisson:
sum(residuals(poisson_counts, type="pearson")^2)/df.residual(poisson_counts)
# [1] 145.4905
E a regressão binomial negativa:
sum(residuals(nb_counts, type="pearson")^2)/df.residual(nb_counts)
# [1] 0.7650289
Alguém é capaz de explicar, SEM USAR EQUAÇÕES, por que a estatística de dispersão para a regressão binomial negativa é consideravelmente menor que a estatística de dispersão para a regressão de poisson?
Para o modelo de Poisson, se o expection para o th observação Y i é μ i sua variância é μ i , & a Pearson residual por conseguinteEu YEu μEu μEu
em que μ é a estimativa da média. A parametrização do modelo binomial negativo usado no MASS é explicada aqui . Se a expectativa para a i- ésima observação Y i é μ i, sua variação é μ i + μ 2μ^ Eu YEu μEu e, portanto, o resíduo de PearsonμEu+ μ2θ
fonte