Problema
Na regressão, geralmente calcula-se o erro quadrático médio (MSE) de uma amostra: para medir a qualidade de um preditor.
No momento, estou trabalhando em um problema de regressão em que o objetivo é prever o preço que os clientes estão dispostos a pagar por um produto, devido a vários recursos numéricos. Se o preço previsto for muito alto, nenhum cliente comprará o produto, mas a perda monetária será baixa porque o preço pode simplesmente ser diminuído. Obviamente, não deve ser muito alto, pois o produto não poderá ser comprado por um longo tempo. Por outro lado, se o preço previsto for muito baixo, o produto será comprado rapidamente, sem a chance de ajustar o preço.
Em outras palavras, o algoritmo de aprendizado deve prever preços ligeiramente mais altos que podem ser diminuídos, se necessário, em vez de subestimar o preço real, o que resultará em uma perda monetária imediata.
Questão
Como você projetaria uma métrica de erro incorporando essa assimetria de custo?
Solução possível
Uma maneira de definir uma função de perda assimétrica seria simplesmente multiplicar por um peso: com sendo o parâmetro que podemos ajustar para alterar o grau de assimetria. Eu encontrei aqui . Parece a coisa mais direta a se fazer, mantendo a perda quadrática.ct∈(0,1)
fonte
Respostas:
Como mencionado nos comentários acima, a regressão quantílica usa uma função de perda assimétrica (linear, mas com inclinações diferentes para erros positivos e negativos). O análogo quadrático (perda ao quadrado) da regressão quantílica é regressão esperada.
Você pode pesquisar no Google a regressão quantílica para as referências. Para regressão esperada, consulte o pacote R expectreg e as referências no manual de referência.
fonte
Esse tipo de ponderação desigual geralmente é realizado em problemas de classificação com duas classes. A regra de Bayes pode ser modificada usando uma função de perda que pesa a perda mais alto para um erro que o outro. Isso levará a uma regra que produz taxas de erro desiguais.
Na regressão, certamente seria possível construir uma função de peso, como uma soma ponderada de quadrados que dará algum peso aos erros negativos e um peso maior aos positivos. Isso seria semelhante ao quadrado mínimo ponderado, mas um pouco diferente porque os mínimos quadrados ponderados se destinam a problemas em que a variação do erro não é constante no espaço de valores possíveis para as variáveis preditoras. Nesse caso, os pesos são mais altos nos pontos em que a variação de erro é pequena e mais alta em que a variação de erro é grande. Obviamente, isso levará a valores para os parâmetros de regressão diferentes do que o OLS forneceria.
fonte