Estou implementando validação cruzada e calculando métricas de erro como RMSE, , MAE, MSE, etc.
RMSE e MAE podem ter o mesmo valor?
cross-validation
rms
mae
Perl
fonte
fonte
Respostas:
Sim, em teoria. O caso mais simples que posso imaginar é um conjunto de dados em que todos os erros de previsão (ou seja, resíduos) são exatamente 1. O RMSE e o MAE retornarão valores idênticos de 1. É possível construir outros cenários também, mas nenhum parece muito provável.±
EDIT: Agradecemos a @DilipSarwate por apontar (mais elaborado por @ user20160 em sua excelente resposta) que esse resultado é possível se e somente se os valores absolutos de todos os erros de previsão forem idênticos. Não há nada de especial no valor 1 no meu exemplo, em outras palavras; qualquer outro número funcionaria em vez de 1.±
fonte
O erro absoluto médio (MAE) pode ser igual ao erro quadrático médio (MSE) ou erro quadrático médio da raiz (RMSE) sob certas condições, que mostrarei abaixo. É improvável que essas condições ocorram na prática.
Preliminares
VamosrEu= | yEu- y^Eu| denote o valor absoluto do residual para o Eu ésimo ponto de dados e seja um vetor que contém resíduos absolutos para todos os pontos no conjunto de dados. Permitindo denotar um vetor de um, o MAE, MSE e RMSE podem ser escritos como:r = [ rEu, … , Rn]T n 1 1⃗ n × 1
MSE
Definir o MSE igual ao MAE e reorganizar fornece:
O MSE e o MAE são iguais para todos os conjuntos de dados em que os resíduos absolutos resolvem a equação acima. Duas soluções óbvias são: (não há erro zero) (os resíduos são todos , como mkt mencionado). Mas, existem infinitas soluções.r = 0⃗ r = 1⃗ ± 1
Pode-se interpretar equação geometricamente como se segue: A LHS é o produto de ponto de e . O produto com ponto zero implica ortogonalidade. Portanto, o MSE e o MAE são iguais se a subtração de 1 de cada resíduo absoluto fornecer um vetor ortogonal aos resíduos absolutos originais.( 2 ) r - 1⃗ r
Além disso, completando o quadrado, a equação pode ser reescrita como:( 2 )
Esta equação descreve uma esfera dimensional centrada em com raio . O MSE e o MAE são iguais se e somente se os resíduos absolutos estiverem na superfície dessa hiperesfera.n [ 12, ... , 12]T 1 12n--√
RMSE
Definir o RMSE igual ao MAE e reorganizar fornece:
onde sou a matriz de identidade. O conjunto de soluções é o espaço nulo de ; isto é, o conjunto de todos os tais que . Para encontrar o espaço nulo, observe que é uma matriz com elementos diagonais iguais a e todos os outros elementos iguais a . A instrução corresponde ao sistema de equações:Eu A r A r = → 0 A n × n n - 1 - 1 A r = → 0UMA r A r = 0⃗ UMA n × n n - 1 - 1 A r = 0⃗
Ou reorganizando as coisas:
Ou seja, todo elemento deve ser igual à média dos outros elementos. A única maneira de satisfazer esse requisito é que todos os elementos sejam iguais (esse resultado também pode ser obtido considerando-se a composição automática de ). Portanto, o conjunto de soluções consiste em todos os vetores não negativos com entradas idênticas:rEu UMA
Portanto, o RMSE e o MAE são iguais se e somente se os valores absolutos dos resíduos forem iguais para todos os pontos de dados.
fonte