R: normalidade de teste de resíduos do modelo linear

Eu gostaria de fazer um teste W de Shapiro Wilk e um teste Kolmogorov-Smirnov sobre os resíduos de um modelo linear para verificar a normalidade. Eu só estava me perguntando quais resíduos devem ser usados para isso - os resíduos brutos, os resíduos de Pearson, resíduos estudantis ou resíduos padronizados? Para um teste W de Shapiro-Wilk, parece que os resultados para os resíduos brutos e de Pearson são idênticos, mas não para os outros.

fit=lm(mpg ~ 1 + hp + wt, data=mtcars)
res1=residuals(fit,type="response")
res2=residuals(fit,type="pearson")
res3=rstudent(fit)
res4=rstandard(fit)
shapiro.test(res1) # W = 0.9279, p-value = 0.03427
shapiro.test(res2) # W = 0.9279, p-value = 0.03427
shapiro.test(res3) # W = 0.9058, p-value = 0.008722
shapiro.test(res4) # W = 0.9205, p-value = 0.02143

Mesma pergunta para KS e também se os resíduos devem ser testados contra uma distribuição normal (pnorm) como em

ks.test(res1, "pnorm") # D = 0.296, p-value = 0.005563

ou uma distribuição t-student com graus de liberdade nk-2, como em

ks.test(res3, "pt",df=nrow(mtcars)-2-2)

Algum conselho, talvez? Além disso, quais são os valores recomendados para as estatísticas de teste W (> 0,9?) E D para que a distribuição esteja suficientemente próxima da normalidade e não afete muito sua inferência?

Por fim, essa abordagem leva em consideração a incerteza nos coeficientes lm ajustados ou a funcionalidade cumres()do pacote gof()seria melhor nesse sentido?

Saúde, Tom

r regression residuals normality-assumption lm Tom Wenseleers
fonte

É raro um teste desse tipo ter alguma razão. Pergunte a si mesmo que ações específicas você tomaria se os resíduos fossem "significativamente" não normais. A experiência ensina que depende de como e quanto eles diferem da normalidade. Nenhum deles é medido diretamente (ou adequadamente) por SW, KS ou qualquer outro teste formal de distribuição. Para este trabalho, você deseja empregar gráficos exploratórios, não testes formais. A questão de quais resíduos podem ser adequados para plotagem ainda permanece, mas as questões restantes caem para o caminho como irrelevantes.

whuber

Sim, eu notei que muitos estatísticos defendem essa posição. Mas eu ainda gostaria de verificar as estatísticas dos testes (por exemplo, verifique se o valor de Shapiro Wilks W é maior que 0,9). E eu sempre poderia fazer uma transformação de Box-Cox ou algo assim para melhorar a normalidade em caso de grandes desvios. Além disso, a minha pergunta era também parte conceitual - ou seja, qual seria a maneira mais correta de fazer isso, mesmo que a normalidade não é sempre tão importante na prática ...

Tom Wenseleers

Cresceu muito tempo para um comentário.

Para um modelo de regressão comum (como seria ajustado por lm), não há distinção entre os dois primeiros tipos residuais que você considera; type="pearson"é relevante para GLMs não gaussianos, mas é o mesmo que responsepara modelos gaussianos.
As observações às quais você aplica seus testes (alguma forma de resíduo) não são independentes; portanto, as estatísticas usuais não têm a distribuição correta. Além disso, estritamente falando, nenhum dos resíduos que você considera será exatamente normal, pois seus dados nunca serão exatamente normais. [O teste formal responde à pergunta errada - uma pergunta mais relevante seria 'até que ponto essa não normalidade afetará minha inferência?', Pergunta não respondida pela bondade usual do teste de hipótese de ajuste.]
Mesmo que seus dados fossem exatamente normais, nem o terceiro nem o quarto tipo de resíduo seria exatamente normal. No entanto, é muito mais comum que as pessoas as examinem (digamos por gráficos QQ) do que os resíduos brutos.
$\mathbf{X}$

Glen_b -Reinstate Monica
fonte

R: normalidade de teste de resíduos do modelo linear - quais resíduos usar

Respostas: