Este artigo utiliza modelos lineares generalizados (distribuições binomiais e negativas de erros binomiais negativos) para analisar dados. Mas então, na seção de análise estatística dos métodos, há esta declaração:
... e segundo modelando os dados de presença usando Modelos de Regressão Logística e os dados de tempo de forrageamento usando um Modelo Linear Generalizado (GLM). Uma distribuição binomial negativa com uma função de link de log foi usada para modelar os dados do tempo de forrageamento (Welsh et al. 1996) e a adequação do modelo foi verificada pelo exame de residentes (McCullagh & Nelder 1989). Os testes de Shapiro – Wilk ou Kolmogorov – Smirnov foram utilizados para testar a normalidade, dependendo do tamanho da amostra; os dados foram transformados em log antes das análises para aderir à normalidade.
Se eles assumem distribuições binomiais e negativas de erros binomiais negativos, certamente não devem verificar a normalidade dos resíduos?
fonte
Respostas:
Nota: os resíduos de desvio (ou Pearson) não devem ter uma distribuição normal, exceto para um modelo gaussiano. Para o caso de regressão logística, como diz @Stat, resíduos deviance para o th observação y i são dadas porEu yEu
se eyEu= 0
se , onde ^ π i é a probabilidade ajustada de Bernoulli. Como cada um pode ter apenas um dos dois valores, fica claro que sua distribuição não pode ser normal, mesmo para um modelo especificado corretamente:yEu= 1 πEu^
As coisas são semelhantes para Poisson ou GLMs binomiais negativos: para contagens previstas baixas, a distribuição de resíduos é discreta e distorcida, mas tende à normalidade para contagens maiores em um modelo especificado corretamente.
Não é comum, pelo menos não no meu pescoço, realizar um teste formal de normalidade residual; se o teste de normalidade é essencialmente inútil quando seu modelo assume a normalidade exata, a fortiori é inútil quando não. No entanto, para modelos não saturados, o diagnóstico gráfico de resíduos é útil para avaliar a presença e a natureza da falta de ajuste, normalizando com uma pitada ou um punhado de sal, dependendo do número de repetições por padrão preditivo.
fonte
O que eles fizeram está correto! Vou lhe dar uma referência para verificar novamente. Consulte a Seção 13.4.4 em Introdução à análise de regressão linear, 5ª ediçãopor Douglas C. Montgomery, Elizabeth A. Peck, G. Geoffrey Vining. Em particular, veja os exemplos na página 460, onde eles se encaixam em um binômio glm e verifique duas vezes a suposição de normalidade dos "Deviance Residuals". Como mencionado na página 458, isso ocorre porque "os resíduos de desvio se comportam como os resíduos comuns em um modelo de regressão linear da teoria normal padrão". Portanto, faz sentido se você os plotar na escala normal de plotagem de probabilidade, bem como vs valores ajustados. Novamente, consulte a página 456 da referência acima. Nos exemplos que eles forneceram nas páginas 460 e 461, não apenas para o caso binomial, mas também para o Poisson glm e o Gamma com (link = log), eles verificaram a normalidade dos resíduos de desvio.
Para o caso binomial, o desvio residual é definido como:
Verifique aqui também o caso Poisson.
fonte