Calculando a probabilidade do RMSE

13

Eu tenho um modelo para prever uma trajetória (x em função do tempo) com vários parâmetros. No momento, calculo o erro quadrático médio da raiz (RMSE) entre a trajetória prevista e a trajetória registrada experimentalmente. Atualmente, minimizo essa diferença (o RMSE) usando simplex (fminsearch no matlab). Embora esse método funcione para dar bons ajustes, eu gostaria de comparar vários modelos diferentes, então acho que preciso calcular a probabilidade para poder usar a estimativa de probabilidade máxima em vez de minimizar o RMSE (e comparar os modelos usando AIC ou BIC ) Existe alguma maneira padrão de fazer isso?

Jason
fonte

Respostas:

20

O erro quadrático médio raiz e a probabilidade estão realmente intimamente relacionadas. Digamos que você tenha um conjunto de dados de pares e deseje modelar o relacionamento deles usando o modelo f . Você decide minimizar o erro quadrático{xEu,zEu}f

Eu(f(xEu)-zEu)2

Essa escolha não é totalmente arbitrária? Claro, você deseja penalizar estimativas que estão completamente erradas mais do que aquelas que estão quase certas. Mas há uma boa razão para usar o erro ao quadrado.

Lembre-se da densidade gaussiana: ondeZé a constante de normalização com a qual não nos importamos no momento. Vamos supor que seus dados de destinozsejam distribuídos de acordo com um gaussiano. Para que possamos anotar a probabilidade dos dados.1Zexp-(x-μ)22σ2Zz

eu=Eu1Zexp-(f(xEu)-zEu)22σ2

Agora, se você pegar o logaritmo disso ...

registroeu=Eu-(f(xEu)-zEu)22σ2-registroZ

... acontece que está intimamente relacionado às rms: as únicas diferenças são alguns termos constantes, uma raiz quadrada e uma multiplicação.

Resumindo a história: Minimizar o erro médio quadrático raiz é equivalente a maximizar a probabilidade de log dos dados.

bayerj
fonte
Obrigado pela explicação clara. Portanto, se eu quiser comparar dois modelos (não incorporados) usando o BIC, posso simplesmente largar os termos sigma ^ 2 e Z (assumindo efetivamente que são iguais entre os modelos) ao calcular a probabilidade?
Jason
σσ
1
registroeu=Eu(f(xEu)-zEu)22σ2-registroZ
2
Falta algum sinal negativo na distribuição gaussiana?
Manoj
1
σ