Uma regra de pontuação adequada é uma regra que é maximizada por um modelo 'verdadeiro' e não permite 'hedging' ou jogo do sistema (relatando deliberadamente resultados diferentes, como é a crença verdadeira do modelo para melhorar a pontuação). A pontuação Brier é adequada, a precisão (proporção classificada corretamente) é inadequada e muitas vezes desencorajada. Às vezes, vejo que a AUC é chamada de regra de pontuação semi-adequada, o que a torna não totalmente falsa como precisão, mas menos sensível que as regras apropriadas (por exemplo, aqui /stats//a/90705/53084 ).
O que significa a regra de pontuação semi-adequada? Está definido em algum lugar?
Respostas:
Vamos começar com um exemplo. Say Alice é uma treinadora de trilhas e quer escolher um atleta para representar o time em um próximo evento esportivo, um sprint de 200m. Naturalmente, ela quer escolher o corredor mais rápido.
Embora um pouco banalizado, o exemplo acima mostra o que ocorre com o uso de regras de pontuação. Alice estava prevendo o tempo esperado para o sprint. Dentro do contexto da classificação, prevemos probabilidades, minimizando o erro de um classificador probabilístico.
Como vemos , a regra de pontuação semi-adequada não é perfeita, mas também não é totalmente catastrófica. Na verdade, pode ser bastante útil durante a previsão! Cagdas Ozgenc tem um ótimo exemplo aqui, onde trabalhar com uma regra imprópria / semi-adequada é preferível a uma regra estritamente apropriada. Em geral, o termo regra de pontuação semi-adequada não é muito comum. Está associado a regras impróprias que podem, no entanto, ser úteis (por exemplo, AUC-ROC ou MAE na classificação probabilística).
Finalmente, observe algo importante. Como a corrida está associada a pernas fortes, o mesmo ocorre com a classificação probabilística correta com Precisão. É improvável que um bom velocista tenha pernas fracas e, da mesma forma, é improvável que um bom classificador tenha uma Precisão ruim. No entanto, equiparar precisão com bom desempenho do classificador é como equiparar a força das pernas a um bom desempenho de corrida. Não é completamente infundado, mas muito plausível para levar a resultados sem sentido.
fonte