A razão pela qual pergunto isso é porque parece que os resíduos estudados internamente parecem ter o mesmo padrão que os resíduos estimados brutos. Seria ótimo se alguém pudesse oferecer uma explicação.
10
Suponha um modelo de regressão de com matriz de design X (a uma coluna seguido por seus preditores), as previsões y = X ( X ' X ) - 1 X ' Y = H y (onde H é o "hat- matriz "), e os resíduos de e = y - y . O modelo de regressão assume que os verdadeiros erros £ todos têm a mesma variância (homocedasticidade):
Em quais tipos de dados você realizou suas plotagens de teste? Quando todas as suposições se mantêm (ou se aproximam), então eu não esperaria muita diferença entre os resíduos brutos e os resíduos estudantis, a principal vantagem é quando há pontos de alta influência. Considere estes dados (simulados) que têm uma tendência linear positiva e um outlier altamente influente:
Aqui está o gráfico dos valores ajustados versus os resíduos brutos:
Observe que o valor do resíduo de nosso ponto de influência é mais próximo de 0 do que os resíduos mínimos e máximos do restante dos pontos (não está nos três resíduos brutos mais extremos).
Agora, aqui está o gráfico com os resíduos padronizados (internamente estudados):
Nesse gráfico, destaca-se o residual padronizado, porque sua influência foi contabilizada.
fonte