Qual é a diferença entre erros e resíduos?

20

Embora esses dois termos onipresentes sejam freqüentemente usados ​​como sinônimos, às vezes parece haver uma distinção. Existe realmente uma diferença, ou eles são exatamente sinônimos?

Constantin
fonte
Confira Qin & Gilbert "O Termo do Erro na História da Econometria de Séries Temporais" para obter um tratamento abrangente, se você tiver tempo. Ah, mas isso é apenas para dados de séries temporais.
Richard Hardy

Respostas:

20

Os erros pertencem ao verdadeiro processo de geração de dados (DGP), enquanto os resíduos são o que resta depois de ter estimado o seu modelo. Na verdade, suposições como normalidade, homoscedasticidade e independência se aplicam aos erros do DGP, não aos resíduos do seu modelo. (Por exemplo, tendoparâmetrosadequadosem seu modelo, apenasresíduospodem ser independentes.) No entanto, só temos acesso aos resíduos, e é com isso que trabalhamos. p+1N(p+1)

- Reinstate Monica
fonte
9
(+1) Os resíduos podem ser considerados estimativas dos erros.
Scortchi - Restabelece Monica
@ABC, DGPsignifica processo de geração de dados . Mesmo que seu modelo seja apropriado e reflita a verdadeira estrutura do DGP, os resíduos não serão necessariamente normais, homoscedásticos e independentes se os erros subjacentes não forem.
gung - Restabelece Monica
@ Scortchi Oi, você tem alguma referência que se expanda no seu comentário? Estou tentando entender por que exatamente os resíduos podem ser usados ​​como estimativas do erro, porque vejo pessoas verificando a normalidade dos resíduos na análise de regressão quando a suposição real é a normalidade do erro e não sei exatamente por que isso é válido.
Austin
@ Austin, se você ainda estiver interessado nisso, faça uma nova pergunta.
gung - Restabelece Monica
13

Um erro é a diferença entre o valor observado e o valor verdadeiro (muitas vezes não observado, gerado pelo DGP).

Um resíduo é a diferença entre o valor observado e o valor previsto (pelo modelo).

Leopold W.
fonte
Em resposta ao erro "muitas vezes não observado", na realidade nunca poderíamos observar o valor verdadeiro absoluto. Todo dispositivo de medição possui um erro finito inerente ao dispositivo de medição. O melhor que você poderia alegar é que o valor verdadeiro em um ponto é igual ao que for medido mais / menos o erro observacional ou erro de medição, por exemplo, minha régua pode incrementar distâncias até 1 mm, para que o melhor que eu possa medir seja o comprimento real do meu o lápis está dentro de 0.1mm. Observe que isso difere de qualquer erro sistemático, por exemplo, minha régua foi de alguma forma esticada durante a fabricação e mediu muito tempo. ±
Steven C. Howell
Este link ( ece.rochester.edu/courses/ECE111/error_unertosty.pdf ) fornece uma boa explicação com referências aos textos de Bevington e Taylor sobre o assunto.
Steven C. Howell
Na linguagem de aprendizado de máquina, resíduo é o erro de treinamento e erro é erro de teste?
Charles Chow
@CharlesChow Depende de qual conjunto de dados você usa. Se você usar um conjunto de treinamento, será um erro de treinamento; se você usar o conjunto de teste, será um erro de teste.
Leopold W.
7

Termo de erro é um conceito teórico que nunca pode ser observado, mas o residual é um valor do mundo real que é calculado para cada vez que uma regressão é feita

Kudzai Lemiel Munyukwa
fonte