Um erro padrão estimado é o desvio padrão σ ( θ ) de um estimador θ para um parâmetro θ .
Por que o desvio padrão estimado dos resíduos é chamado de "erro padrão residual" (por exemplo, na saída da summary.lm
função de R ) e não "desvio padrão residual"? Que estimativa de parâmetro nós equipamos com um erro padrão aqui?
Consideramos cada resíduo como um estimador para o termo de erro "seu" e estimamos o erro padrão "agrupado" de todos esses estimadores?
r
standard-error
residuals
terminology
Michael M
fonte
fonte
Respostas:
Eu acho que o fraseado é específico para a
summary.lm()
saída de R. Observe que o valor subjacente é realmente chamado "sigma" (summary.lm()$sigma
). Eu não acho que outro software necessariamente use esse nome para o desvio padrão dos resíduos. Além disso, a expressão "desvio padrão residual" é comum em livros didáticos, por exemplo. Não sei como foi o fraseado usado nasummary.lm()
saída de R , mas sempre achei estranho.fonte
summary.lm(reg)$sigma
diferençasd(reg$residuals)
?stats::sigma
: O equívoco "Erro padrão residual" fez parte de muitas saídas R (e S) para serem facilmente alteradas lá.No meu treinamento em econometria, ele é chamado de "erro padrão residual" porque é uma estimativa do "desvio padrão residual" real. Veja esta pergunta relacionada que corrobora essa terminologia.
Uma pesquisa no Google pelo termo erro padrão residual também mostra muitos acessos; portanto, isso não é de forma alguma uma raridade de R. Tentei ambos os termos com aspas e ambos aparecem aproximadamente 60.000 vezes.
fonte
Erro padrão - Wikipedia, a enciclopédia livre
fonte
Um modelo de regressão ajustado usa os parâmetros para gerar previsões de estimativa pontual, que são os meios das respostas observadas se você replicar o estudo com os mesmos valores XX um número infinito de vezes ( quando o modelo linear for verdadeiro ).
A diferença entre esses valores previstos e os usados para ajustar o modelo é denominada " Residuais " que, ao replicar o processo de coleta de dados, possuem propriedades de variáveis aleatórias com 0 médias. Os resíduos observados são então utilizados para estimar subsequentemente a variabilidade nesses valores e para estimar a distribuição amostral dos parâmetros.
Nota:
Quando o erro padrão residual é exatamente 0, o modelo se ajusta perfeitamente aos dados (provavelmente devido ao sobreajuste).
Se não for possível demonstrar que o erro padrão residual é significativamente diferente da variabilidade na resposta incondicional, há pouca evidência para sugerir que o modelo linear tenha alguma capacidade preditiva.
fonte