MAD = Desvio Absoluto Médio MSE = Erro Quadrático Médio
Vi sugestões de vários lugares em que o MSE é usado, apesar de algumas qualidades indesejáveis (por exemplo , http://www.stat.nus.edu.sg/~staxyc/T12.pdf , que afirma na p8 "Acredita-se que MAD é um critério melhor que o MSE. No entanto, matematicamente o MSE é mais conveniente que o MAD. ")
Existe mais do que isso? Existe um artigo que analise minuciosamente as situações nas quais vários métodos de medir o erro de previsão são mais / menos apropriados? Minhas pesquisas no Google não revelaram nada.
Uma pergunta semelhante a essa foi feita em /programming/13391376/how-to-decide-the-forecasting-method-from-the-me-mad-mse-sde , e o usuário foi solicitado a postar em stats.stackexchange.com, mas acho que nunca.
fonte
Respostas:
Para decidir qual medida de erro de previsão pontual usar, precisamos dar um passo atrás. Observe que não conhecemos o resultado futuro perfeitamente, nem jamais saberemos. Portanto, o resultado futuro segue uma distribuição de probabilidade . Alguns métodos de previsão produzem explicitamente uma distribuição completa, e outros não - mas estão sempre lá, mesmo que implicitamente.
Agora, queremos ter uma boa medida de erro para uma previsão de pontos . Tal previsão pontualFt é nossa tentativa de resumir o que sabemos sobre a distribuição futura (isto é, a distribuição preditiva) no tempo t usando um único número, a chamada funcionalidade da densidade futura. A medida de erro, então, é uma maneira de avaliar a qualidade desse resumo de número único.
Portanto, você deve escolher uma medida de erro que recompense "bons" resumos de um número de densidades futuras (desconhecidas, possivelmente previstas, mas possivelmente implícitas).
O desafio é que diferentes medidas de erro sejam minimizadas por diferentes funcionais. O MSE esperado é minimizado pelo valor esperado da distribuição futura. O MAD esperado é minimizado pela mediana da distribuição futura. Portanto, se você calibrar suas previsões para minimizar o MAE, sua previsão pontual será a mediana futura, não o valor esperado futuro, e suas previsões serão tendenciosas se sua distribuição futura não for simétrica.
Isso é mais relevante para dados de contagem, que normalmente são distorcidos. Em casos extremos (digamos, Poisson distribuiu vendas com uma média abaixo dolog2≈0.69 ), seu MAE será mais baixo para uma previsão de zero plana. Veja aqui ou aqui ou aqui para detalhes.
Fornecemos mais informações e uma ilustração em Quais são as deficiências do Erro Médio Percentual Absoluto (MAPE)? Esse encadeamento considera o mape , mas também outras medidas de erro, e contém links para outros encadeamentos relacionados.
No final, qual medida de erro a ser usada realmente depende do seu erro de custo de previsão, ou seja, que tipo de erro é mais doloroso. Sem considerar as implicações reais dos erros de previsão, qualquer discussão sobre "melhores critérios" é basicamente sem sentido.
As medidas de precisão das previsões foram um tópico importante na comunidade de previsões há alguns anos e ainda aparecem de vez em quando. Um artigo muito bom para analisar é Hyndman & Koehler "Outro exame sobre as medidas de precisão das previsões" (2006).
Finalmente, uma alternativa é calcular densidades preditivas completas e avaliá-las usando regras de pontuação adequadas .
fonte
As vantagens de usar o MAE em vez do MSE são explicadas em Davydenko e Fildes (2016) , consulte a Seção 3.1:
Referências
Davydenko, A., & Fildes, R. (2016). Medidas de erro de previsão: revisão crítica e recomendações práticas. Em Previsão de Negócios: Problemas Práticos e Soluções. John Wiley & Filhos
fonte
Na realidade,
(MAE≤RMSE≤MAE−−−−−√ for classification with partial class memberships yi and/or y^i are ∈[0,1] -- i.e. they can actually take values in between 0 and 1).
(This upper bound occurs for integer
If the RMSE is close the MAE, you have many small deviations, if it is close to its upper bound, there are few grossly wrong predictions.
fonte