Estou trabalhando em modelos de dados de contagem inflada a zero usando o pscl
pacote. Estou apenas me perguntando por que não há desenvolvimento de modelos para modelos de dados de contagem com um inflado! Também por que não há desenvolvimento de modelos de dados bimodais, digamos com zero e 2 inflados! Certa vez, gerei dados de Poisson inflados de maneira única e descobri que nem o modelo glm
com family=poisson
nem o modelo binomial negativo ( glm.nb
) eram bons o suficiente para ajustar bem os dados. Se alguém puder esclarecer meu pensamento, por mais excêntrico que seja, seria muito útil para mim.
r
generalized-linear-model
zero-inflation
poisson-regression
sobrecarregado
fonte
fonte
Respostas:
Um modelo de Poisson inflado para uma contagem éYEu
onde a média de Poisson e a probabilidade de Bernoulli estão relacionadas aos preditores através de funções de link apropriadas. Você pode definir um modelo semelhante para aumentar as probabilidades para quaisquer valores que escolher.μEu πEu
Ainda assim, o zero tem um lugar especial (e antes controverso) entre os números contados - em certo sentido, representando a ausência de qualquer coisa para contar. E é a distinção "nada" vs "alguma coisa", em vez da distinção "um" versus "qualquer outra contagem" que tende a ser relevante em uma ampla gama de fenômenos que gostamos de modelar: há um processo que não dá nada, um , dois, ... contar e outro que não conta.
fonte
score function
ehessian matrix
. Você pode me recomendar algum texto / artigo que possa me ajudar a aprender mais sobre isso?zeroinfl
código devem fazê-lo - alterando a probabilidade e a pontuação de Poisson infladas a zero para corresponder ao modelo acima (ou tente apenas alterar a probabilidade e não passar a pontuação paraoptim
). Obviamente, você também pode perguntar aqui ou no SO, conforme apropriado, para referências ou ajudar com as coisas em que está preso.O pacote R
VGAM
possui uma funçãovglm
que pode ser usada para todos os tipos de modelos do tipo Poisson. Você pode usá-lo para especificar um modelo inflado, algo assimvglm(Y~X,family=oipospoisson(),data=data)
. Veja aqui para mais detalhes.fonte