RMSE vs desvio padrão na população

11

RMSE (erro médio quadrático da raiz) e SD (desvio padrão) têm fórmulas semelhantes.

Este link diz

A única diferença é que você divide por e não pois não está subtraindo a média da amostra aqui. O RMSE corresponderia a . Portanto, a população RMSE é e você deseja um IC para isso.nσ σn1σσ

Então, eu quero saber se RMSE e SD são os mesmos. Além disso, quero referência sobre isso.

JH.Kim
fonte

Respostas:

8

TLDR; Embora as fórmulas possam ser semelhantes, o RMSE e o desvio padrão têm uso diferente.

Você está certo de que o desvio padrão e o RMSE são semelhantes porque são raízes quadradas de diferenças ao quadrado entre alguns valores. No entanto, eles não são os mesmos. O desvio padrão é usado para medir a propagação de dados em torno da média, enquanto o RMSE é usado para medir a distância entre alguns valores e a previsão para esses valores. O RMSE é geralmente usado para medir o erro de previsão, ou seja, quanto as previsões feitas diferem dos dados previstos. Se você usar a média como sua previsão para todos os casos, o RMSE e o SD serão exatamente os mesmos.

Como nota de rodapé, você pode notar que a média é um valor que minimiza a distância ao quadrado de todos os valores da amostra. Esta é a razão pela qual usamos o desvio padrão junto com ele - são espécies relacionadas!

Tim
fonte
1
@ Chill2Macht não se refere à propagação versus distância, mas à propagação de uma única variável versus distância entre os valores previstos e os verdadeiros.
Tim
Isso faz muito sentido, na verdade. Se considerarmos que a distância entre os valores previstos e os verdadeiros é uma variável em si, seria apropriado, na sua opinião, dizer que o RMSE também é uma medida da dispersão dessa variável? "Propagação da distância"?
Chill2Macht
2
@ Chill2Macht mas então você vai ser o cálculo do desvio padrão.
Tim
4
@ Chill2Macht RMSE não tem sd de erros. Sd (erros) = média ((erros - média (erros)) ^ 2) enquanto rmse = média (erros ^ 2)
Tim
1
Vale ressaltar que, quando o erro médio se aproxima de 0 e n se aproxima do infinito sd e rmse convergem.
Morgan Ball