Eu tinha uma pergunta sobre como interpretar os gráficos gerados pelo gráfico (lm) em R. Eu queria saber se vocês poderiam me dizer como interpretar os gráficos de localização em escala e alavancagem-residual? Quaisquer comentários serão apreciados. Assumir conhecimentos básicos de estatística, regressão e econometria.
r
regression
data-visualization
residuals
outliers
Convidado
fonte
fonte
Respostas:
Conforme indicado na documentação ,
plot.lm()
pode retornar 6 gráficos diferentes:Os gráficos [1] , [2] , [3] e [5] são retornados por padrão. A interpretação [1] é discutida no CV aqui: Interpretando resíduos versus plotagem ajustada para verificar as suposições de um modelo linear . Expliquei a suposição de homoscedasticidade e os gráficos que podem ajudá-lo a avaliá-lo (incluindo gráficos de localização em escala [2] ) no currículo aqui: O que significa ter variação constante em um modelo de regressão linear? Eu discuti qq- plot [3] no CV aqui: QQ plot não coincide com histograma e aqui: PP- plot vs. QQ- plot . Também há uma visão geral muito boa aqui: Como interpretar um gráfico QQ? Então, o que resta é basicamente apenas entender [5] , o gráfico de alavancagem residual.
Para entender isso, precisamos entender três coisas:
Com esses fatos em mente, considere os gráficos associados a quatro situações diferentes:
21
Abaixo está o código que eu usei para gerar esses gráficos:
* Para ajudar a entender como a regressão OLS procura encontrar a linha que minimiza as distâncias verticais entre os dados e a linha, veja minha resposta aqui: Qual é a diferença entre a regressão linear em y com xex com y?
fonte