Uma regressão de Poisson é um GLM com uma função de log-link.
Uma maneira alternativa de modelar dados de contagem distribuídos de maneira não-normal é pré-processar usando o log (ou melhor, log (1 + count) para manipular zeros). Se você fizer uma regressão de mínimos quadrados nas respostas de contagem de log, isso está relacionado a uma regressão de Poisson? Ele pode lidar com fenômenos semelhantes?
regression
poisson-distribution
generalized-linear-model
Brendan OConnor
fonte
fonte
Respostas:
Por um lado, em uma regressão de Poisson, o lado esquerdo da equação do modelo é o logaritmo da contagem esperada: .registro( E[ Y| x])
Por outro lado, em um modelo linear "padrão", o lado esquerdo é o valor esperado da variável de resposta normal: . Em particular, a função de link é a função de identidade.E[ Y| x]
Agora, digamos que é uma variável de Poisson e que você pretende normalizá-la usando o log: . Como deveria ser normal, você planeja ajustar o modelo linear padrão para o qual o lado esquerdo é . Mas, em geral, . Como conseqüência, essas duas abordagens de modelagem são diferentes.Y Y′= log( Y) Y′ E[Y′|x]=E[log(Y)|x] E[log(Y)|x]≠log(E[Y|x])
fonte
Eu vejo duas diferenças importantes.
Primeiro, os valores previstos (na escala original) se comportam de maneira diferente; nos mínimos quadrados loglineares representam médias geométricas condicionais; no modelo log-poisson, representam médias condicionais. Como os dados nesse tipo de análise geralmente são inclinados para a direita, a média geométrica condicional subestima a média condicional.
Uma segunda diferença é a distribuição implícita: lognormal versus poisson. Isso se refere à estrutura de heterocedasticidade dos resíduos: variação residual proporcional aos valores esperados ao quadrado (lognormal) versus variação residual proporcional ao valor esperado (Poisson).
fonte
Uma diferença óbvia é que a regressão de Poisson produzirá números inteiros como previsões pontuais, enquanto a regressão linear de contagem de log pode produzir números não inteiros.
fonte