Eu tenho um conjunto de dados que eu esperaria seguir uma distribuição de Poisson, mas ele é superdisperso em cerca de 3 vezes. No momento, estou modelando essa superdispersão usando algo como o código a seguir em R.
## assuming a median value of 1500
med = 1500
rawdist = rpois(1000000,med)
oDdist = rawDist + ((rawDist-med)*3)
Visualmente, isso parece se encaixar muito bem nos meus dados empíricos. Se eu estou feliz com o ajuste, há alguma razão para eu estar fazendo algo mais complexo, como usar uma distribuição binomial negativa, como descrito aqui ? (Se sim, qualquer sugestão ou link sobre isso seria muito apreciada).
Ah, e estou ciente de que isso cria uma distribuição ligeiramente irregular (devido à multiplicação por três), mas isso não deve importar para o meu aplicativo.
Atualização: Para quem procura e encontra essa pergunta, aqui está uma função R simples para modelar um poisson superdisperso usando uma distribuição binomial negativa. Defina d para a razão média / variância desejada:
rpois.od<-function (n, lambda,d=1) {
if (d==1)
rpois(n, lambda)
else
rnbinom(n, size=(lambda/(d-1)), mu=lambda)
}
(através da lista de discussão R: https://stat.ethz.ch/pipermail/r-help/2002-June/022425.html )
fonte
Se o seu valor médio para o Poisson for 1500, você estará muito perto de uma distribuição normal; você pode tentar usar isso como uma aproximação e depois modelar a média e a variação separadamente.
fonte