Suponha que são independentes eY=(Y1,…,Yn)′
Yi=0Yi=kwith probability pi+(1−pi)e−λiwith probability (1−pi)e−λiλki/k!
Suponha também os parâmetros e p = ( p 1 , ... , p n ) satisfazemλ=(λ1,…,λn)′p=(p1,…,pn)
log(λ)logit(p)=Bβ=log(p/(1−p))=Gλ.
Se os mesmos co-variáveis afetam e p de modo que B = G , então por que de zero inflado regressão de Poisson requer o dobro de parâmetros como a regressão de Poisson?λpB=G
Respostas:
No caso de Poisson de zero-inflado, se , em seguida, β e λ ambos têm o mesmo comprimento, o qual é o número de colunas de B ou L . Portanto, o número de parâmetros é o dobro do número de colunas da matriz de projeto, ou seja, o dobro do número de variáveis explicativas, incluindo a interceptação (e qualquer codificação fictícia necessária).B = G β λ B G
Em uma regressão de Poisson reta, não há um vetor com o qual se preocupar, não há necessidade de estimar λ . Portanto, o número de parâmetros é apenas o comprimento de β, ou seja, metade do número de parâmetros no caso de zero inflado.p λ β
Agora, não há nenhuma razão específica para ser igual a G , mas geralmente faz sentido. No entanto, pode-se imaginar um processo de geração de dados em que a chance de ter algum evento seja criada por um processo G λ e um processo completamente diferente B β direciona quantos eventos existem, dados eventos diferentes de zero. Como exemplo, eu escolho as salas de aula com base nas notas dos exames de História para jogar algum jogo não relacionado e depois observo o número de gols que marcam. Nesse caso, B pode ser bem diferente de G (se as coisas que conduzem os resultados dos exames de História são diferentes das que conduzem o desempenho no jogo) e β e λB G G λ B β B G β λ pode ter comprimentos diferentes. pode ter mais colunas que B ou menos. Portanto, o modelo de Poisson inflado a zero nesse caso terá mais parâmetros do que um modelo simples de Poisson.G B
Na prática comum, acho que maioria das vezes.G = B
fonte