No método dos mínimos quadrados, queremos estimar os parâmetros desconhecidos no modelo:
Depois de fazer isso (para alguns valores observados), obtemos a linha de regressão ajustada:
Agora, obviamente, queremos verificar alguns gráficos para garantir que as suposições sejam cumpridas. Suponha que você queira verificar a homoscedasticidade; no entanto, para fazer isso, estamos realmente verificando os resíduos . Digamos que você examine o gráfico de valores residuais vs valores previstos, se isso nos mostra que a heterocedasticidade é aparente, então como isso se relaciona com o termo de perturbação ? A heterocedasticidade nos resíduos implica heterocedasticidade em termos de perturbação? ε j
A relação entre ε e ε é:ε^ ε
onde , a matriz de chapéu, é X ( X T X ) - 1 X t .H X( XTX)- 1XT
O que significa dizer que ε i é uma combinação linear de todos os erros, mas geralmente a maioria do peso recai sobre o i um -ésimo.ε^Eu Eu
Aqui está um exemplo, usando o
cars
conjunto de dados em R. Considere o ponto marcado em roxo:Podemos reescrever isso como:
ou mais geralmente
Ou seja, em regressões bem comportadas, os resíduos podem ser tratados principalmente como uma estimativa moderadamente barulhenta de não observável o termo de erro. À medida que consideramos pontos mais distantes do centro, as coisas funcionam de maneira menos agradável (o resíduo se torna menos ponderado no erro e os pesos nos outros erros se tornam menos uniformes).
fonte