Residuais em regressão de poisson

9

O Guia para Iniciantes do Zuur 2013 do GLM e GLMM sugere a validação de uma regressão de Poisson, plotando os resíduos de Pearsons em relação aos valores ajustados. Zuur afirma que não devemos ver os resíduos se espalhando à medida que os valores ajustados aumentam, como o gráfico anexado (desenhado à mão).

Mas eu pensei que uma característica chave da distribuição de Poisson é que a variação aumenta à medida que a média aumenta. Portanto, não devemos esperar ver uma variação crescente nos resíduos à medida que os valores ajustados aumentam?

insira a descrição da imagem aqui

luciano
fonte

Respostas:

24

A distinção é clara assim que você entende o que é um resíduo de Pearson.

Você está certo que, para um modelo de Poisson, a variação aumenta à medida que a média aumenta.

Como resultado, os resíduos brutos comuns ( ) devem ter um spread que aumenta com os valores ajustados (embora não em proporção).ri=yiμ^i

No entanto, os resíduos de Pearson são residuais divididos pela raiz quadrada da variação de acordo com o modelo ( para um modelo de Poisson). Isso significa que, se o modelo estiver correto, os resíduos de Pearson deverão ter um espalhamento constante.riP=yiμ^iμ^i

Gráficos residuais de um modelo de regressão simples de Poisson simulado.  Gráfico à esquerda: resíduos brutos versus média ajustada mostram aumento da dispersão com a média.  Há "faixas" diagonais nos resíduos porque os dados são discretos.  Gráfico à direita: os resíduos de Pearson mostram o que parece uma propagação constante como mudanças médias e as faixas diagonais agora são curvas.

Glen_b -Reinstate Monica
fonte
Você poderia esclarecer por que escreve que estamos dividindo pela raiz quadrada da variância quando na verdade você está dividindo pela raiz quadrada do valor esperado? Sei que a variação é igual à média de uma distribuição de poisson, mas é uma constante para uma distribuição específica. Portanto, de que variação estamos falando aqui?
kdarras 12/02
1
A distribuição condicional da resposta pode ser diferente em cada combinação de preditores. Daí o uso do subscrito na média; é a média da população (e, portanto, também a variação da população) para a observação , dados seus valores preditores (os valores de seus IVs). μii
Glen_b -Reinstate Monica