RMSE e MAE podem ter o mesmo valor?

9

Estou implementando validação cruzada e calculando métricas de erro como RMSE, , MAE, MSE, etc.R2

RMSE e MAE podem ter o mesmo valor?

Perl
fonte
11
Sim. Por que não? Seja sempre e um preditor de seja sempre . Aí está você0 X 1X0X1
David

Respostas:

17

Sim, em teoria. O caso mais simples que posso imaginar é um conjunto de dados em que todos os erros de previsão (ou seja, resíduos) são exatamente 1. O RMSE e o MAE retornarão valores idênticos de 1. É possível construir outros cenários também, mas nenhum parece muito provável.±

EDIT: Agradecemos a @DilipSarwate por apontar (mais elaborado por @ user20160 em sua excelente resposta) que esse resultado é possível se e somente se os valores absolutos de todos os erros de previsão forem idênticos. Não há nada de especial no valor 1 no meu exemplo, em outras palavras; qualquer outro número funcionaria em vez de 1.±

mkt - Restabelecer Monica
fonte
11
Você poderia dar um exemplo dos outros cenários que você imagina? Quero dizer um exemplo diferente de um múltiplo escalar (quando todos os resíduos são vez de ) do exemplo acima. ± 1±σ±1
Dilip Sarwate
@DilipSarwate Eu estava pensando nisso quando o user20160 adicionou uma resposta muito melhor que a aborda com mais detalhes do que eu poderia.
mkt - Restabelece Monica
11
@mkt Obrigado pelas amáveis ​​palavras. Sua resposta é correta e concisa (+1)
user20160
@DilipSarwate Obrigado pela contribuição
mkt - Reinstate Monica
11
Um par de adornos adicionais à sua resposta: (i) deve ser par (digamos ) e (ii) exatamente resíduos devem ter valor e exatamente resíduos devem ter valor , o que naturalmente significa que todos os resíduos têm valor absoluto como você afirma, mas (ii) garante que os resíduos sejam iguais a conforme necessário. Os resíduos são os desvios da média e, portanto, devem somar a zero. n = 2 k k + σ k - σ σ 0nn=2kk+σkσσ0
Dilip Sarwate
23

O erro absoluto médio (MAE) pode ser igual ao erro quadrático médio (MSE) ou erro quadrático médio da raiz (RMSE) sob certas condições, que mostrarei abaixo. É improvável que essas condições ocorram na prática.

Preliminares

Vamos ri=|yiy^i|denote o valor absoluto do residual para o i ésimo ponto de dados e seja um vetor que contém resíduos absolutos para todos os pontos no conjunto de dados. Permitindo denotar um vetor de um, o MAE, MSE e RMSE podem ser escritos como:r=[ri,,rn]Tn1n×1

(1)MAE=1n1TrMSE=1nrTrRMSE=1nrTr

MSE

Definir o MSE igual ao MAE e reorganizar fornece:

(2)(r1)Tr=0

O MSE e o MAE são iguais para todos os conjuntos de dados em que os resíduos absolutos resolvem a equação acima. Duas soluções óbvias são: (não há erro zero) (os resíduos são todos , como mkt mencionado). Mas, existem infinitas soluções.r=0r=1±1

Pode-se interpretar equação geometricamente como se segue: A LHS é o produto de ponto de e . O produto com ponto zero implica ortogonalidade. Portanto, o MSE e o MAE são iguais se a subtração de 1 de cada resíduo absoluto fornecer um vetor ortogonal aos resíduos absolutos originais.(2)r1r

Além disso, completando o quadrado, a equação pode ser reescrita como:(2)

(3)(r121)T(r121)=n4

Esta equação descreve uma esfera dimensional centrada em com raio . O MSE e o MAE são iguais se e somente se os resíduos absolutos estiverem na superfície dessa hiperesfera.n[12,,12]T12n

RMSE

Definir o RMSE igual ao MAE e reorganizar fornece:

(4)rTAr=0

A=(nI11T)

onde sou a matriz de identidade. O conjunto de soluções é o espaço nulo de ; isto é, o conjunto de todos os tais que . Para encontrar o espaço nulo, observe que é uma matriz com elementos diagonais iguais a e todos os outros elementos iguais a . A instrução corresponde ao sistema de equações:IA r A r = 0 A n × n n - 1 - 1 A r = 0ArAr=0An×nn11Ar=0

(5)(n1)rijirj=0i

Ou reorganizando as coisas:

(6)ri=1n1jirji

Ou seja, todo elemento deve ser igual à média dos outros elementos. A única maneira de satisfazer esse requisito é que todos os elementos sejam iguais (esse resultado também pode ser obtido considerando-se a composição automática de ). Portanto, o conjunto de soluções consiste em todos os vetores não negativos com entradas idênticas:riA

{rr=c1c0}

Portanto, o RMSE e o MAE são iguais se e somente se os valores absolutos dos resíduos forem iguais para todos os pontos de dados.

user20160
fonte
11
+1. Senti a necessidade de verificar se a maior parte dessa hiperesfera se encontra na região onde todos os componentes de são não negativos, o que é uma exigência de resíduos absolutos: isso me convenceu de que realmente existem muitas soluções (não triviais). r
whuber
+1 Ótima resposta!
mkt - Restabelece Monica
11
Na verdade, a questão era se RMSE e MAE podem ser iguais e não se MSE e MAE podem ser iguais. Talvez a resposta de @mkt (ou a versão generalizada que sugeri em um comentário) seja a única resposta para a pergunta RMSE = MAE?
Dilip Sarwate
@DilipSarwate, Sim, percebi depois de postar isso que eu pulei a parte 'R'. Eu editei para incluir o RMSE agora. Eu acredito que a versão que você sugeriu é a única resposta possível neste caso.
User20160 25/08/19
2
@Hiyam Se houver apenas 1 valor, o RMSE, por definição, deverá ser igual ao MAE. Como existe apenas 1 erro, o quadrado e a raiz são retornados apenas ao valor absoluto do erro original.
mkt - Restabelece Monica