Estou tentando modelar as intensidades médias de parasitas que afetam um hospedeiro em R usando um modelo binomial negativo. Eu recebo 50 ou mais avisos que dizem:
In dpois(y, mu, log = TRUE) : non-integer x = 251.529000
Como posso lidar com isso? Meu código fica assim:
mst.nb = glm.nb(Larvae+Nymphs+Adults~B.type+Month+Season, data=MI.df)
Respostas:
O binomial negativo é uma distribuição para os dados de contagem, portanto, você realmente deseja que sua variável de resposta seja contada (ou seja, números inteiros não negativos). Dito isto, é apropriado dar conta de "diferentes esforços de amostragem" (não sei exatamente a que você está se referindo, mas entendo o essencial). No entanto, você não deve tentar fazer isso dividindo suas contagens por outro número. Em vez disso, você precisa usar esse outro número como um deslocamento . Há uma boa discussão no CV sobre o que é um deslocamento: Quando usar um deslocamento em uma regressão de Poisson? Meu palpite é que seu modelo deve ser algo como:
fonte
cbind()
.É um aviso, não um erro fatal. glm.nb () espera contar como sua variável de resultado, que são números inteiros. Seus dados não são números inteiros: 251.529.
R está dizendo "Hmmm ... você pode verificar isso e garantir que está tudo bem, porque pode não parecer certo". Se minha memória estiver correta, o SPSS não emitirá esse aviso.
Se você tiver certeza de que está usando o modelo certo, mesmo que não tenha números inteiros, ignore-o e continue.
fonte
Sou um parasitologista ecológico. A maneira como você deve lidar com isso é vinculando os hosts que foram parasitados e os que não foram e, em seguida, usando uma distribuição binomial. Veja o código abaixo.
Eu também nunca usei uma glm com mais de uma variável y .. então, digamos que você queira observar larvas parasitadas: você teria # larvas saudáveis e # parasitadas.
Vamos dizer: Lh e Lp
Então por exemplo
parasitizedL = cbind (Lp, Lh) hist (parasitized) #Eu acho que você pode usar uma distribuição binomial regular com glm .. e pode não precisar do modelo negativo.binominal PLarvae1 = glm (parasitizedL ~ B.type + Month + Season, família = binomial, dados = MI.df)
faça uma redução gradual do modelo para ver quais dos seus fatores afetam significativamente o parasitismo ... veja o link abaixo
http://bbolker.github.io/mixedmodels-misc/glmmFAQ.html
no entanto, parece que você precisa ter efeitos aleatórios para explicar a amostragem repetitiva. provavelmente o seu efeito aleatório será (1 | Temporada / mês) ... mas difícil de dizer sem conhecer seus dados
fonte