Regressão de Poisson inflada a zero

14

Suponha que são independentes eY=(Y1,...,Yn)

Yi=0with probability pi+(1pi)eλiYi=kwith probability (1pi)eλiλik/k!

Suponha também os parâmetros e p = ( p 1 , ... , p n ) satisfazemλ=(λ1,,λn)p=(p1,,pn)

log(λ)=Bβlogit(p)=log(p/(1p))=Gλ.

Se os mesmos co-variáveis afetam e p de modo que B = G , então por que de zero inflado regressão de Poisson requer o dobro de parâmetros como a regressão de Poisson?λpB=G

Damien
fonte
2
Você ainda precisa estimar e λ . B e G são matrizes de design (dados), portanto, aqueles iguais não reduzem a dimensão do espaço do parâmetro. βλBG
Macro
@ Macro: Se é uma coluna de uns, por que precisamos de mais 1 parâmetro para estimar do que a regressão de Poisson? G
Damien
bem, você precisaria estimar (a "interceptação" na parte logística do modelo) e λ i (a "interceptação" na parte Poisson do modelo) para que haja 2 parâmetros em vez de 1.piλi
Macro
1
@Robby, para reduzir o número de parâmetros que você teria que fazer algumas restrições. Por exemplo, , embora não haja razão para pensar que isso faz sentido - especialmente porque as funções de link são diferentes. λ=β
Macro
3
@ MichaelChernick - é chamado de Poisson inflado com zero porque você está basicamente "inflando" a probabilidade de ver um zero a partir de um ponto de Poisson, mantendo as mesmas probabilidades relativas de ver um valor diferente de zero que o Poisson.
11132 jbowman

Respostas:

2

No caso de Poisson de zero-inflado, se , em seguida, β e λ ambos têm o mesmo comprimento, o qual é o número de colunas de B ou L . Portanto, o número de parâmetros é o dobro do número de colunas da matriz de projeto, ou seja, o dobro do número de variáveis ​​explicativas, incluindo a interceptação (e qualquer codificação fictícia necessária).B=GβλBG

Em uma regressão de Poisson reta, não há um vetor com o qual se preocupar, não há necessidade de estimar λ . Portanto, o número de parâmetros é apenas o comprimento de β, ou seja, metade do número de parâmetros no caso de zero inflado.pλβ

Agora, não há nenhuma razão específica para ser igual a G , mas geralmente faz sentido. No entanto, pode-se imaginar um processo de geração de dados em que a chance de ter algum evento seja criada por um processo G λ e um processo completamente diferente B β direciona quantos eventos existem, dados eventos diferentes de zero. Como exemplo, eu escolho as salas de aula com base nas notas dos exames de História para jogar algum jogo não relacionado e depois observo o número de gols que marcam. Nesse caso, B pode ser bem diferente de G (se as coisas que conduzem os resultados dos exames de História são diferentes das que conduzem o desempenho no jogo) e β e λBGGλBβBGβλpode ter comprimentos diferentes. pode ter mais colunas que B ou menos. Portanto, o modelo de Poisson inflado a zero nesse caso terá mais parâmetros do que um modelo simples de Poisson.GB

Na prática comum, acho que maioria das vezes.G=B

Peter Ellis
fonte