Estou surpreso que isso não tenha sido feito antes, mas não consigo encontrar a pergunta em stats.stackexchange.
Esta é a fórmula para calcular a variação de uma amostra normalmente distribuída:
Esta é a fórmula para calcular o erro quadrático médio das observações em uma regressão linear simples:
Qual é a diferença entre essas duas fórmulas? A única diferença que posso ver é que o MSE usa . Então, se essa é a única diferença, por que não se referir a elas como a variação, mas com diferentes graus de liberdade?
Respostas:
O erro quadrático médio que você escreveu para o OLS está ocultando algo:
No entanto, você está no caminho certo ao perceber que essas são quantidades conceitualmente semelhantes. A variação da amostra mede a dispersão dos dados em torno da média da amostra (em unidades ao quadrado), enquanto o MSE mede a dispersão vertical dos dados em torno da linha de regressão da amostra (em unidades verticais ao quadrado).
fonte
fonte