TL; DR
A precisão é uma regra de pontuação inadequada. Não use.
A versão um pouco mais longa
Na verdade, a precisão nem sequer é uma regra de pontuação. Então, perguntar se é (estritamente) adequado é um erro de categoria. O máximo que podemos dizer é que sob suposições adicionais , a precisão é consistente com uma regra de pontuação inadequada, descontínua e enganosa. (Não use.)
Sua confusão
Sua confusão decorre do fato de que a perda de classificação incorreta conforme o artigo que você cita também não é uma regra de pontuação.
Os detalhes: regras de pontuação x avaliações de classificação
Vamos corrigir a terminologia. Estamos interessados em um resultado binário , e que tem uma previsão probabilística q = P ( Y = 1 ) ∈ ( 0 , 1 ) . Nós sabemos que P ( Y = 1 ) = η > 0,5 , mas o nosso modelo qy∈{0,1}qˆ=Pˆ(Y=1)∈(0,1)P(Y=1)=η>0.5qˆ pode ou não saber que.
A regra de pontuação é um mapeamento que leva uma previsão probabilística q e um resultado y de uma perda,qˆy
s:(qˆ,y)↦s(qˆ,y).
éapropriadase for optimizado na expectativa por q = η . ( "Optimized" geralmente significa "minimizado", mas sinais alguns autores aleta e tentar maximizar uma regra de pontuação.) S éestritamente adequadose ele é otimizado na expectativaúnicapor q = ηsqˆ=ηsqˆ=η .
Nós normalmente avaliar em muitas previsões q i e os resultados correspondentes y i e média para estimar esta expectativa.sqˆiyi
Agora, o que é precisão ? A precisão não aceita uma previsão probabilística como argumento. É preciso uma classificação y ∈ { 0 , 1 }yˆ∈{0,1} e um resultado:
a:(yˆ,y)↦a(yˆ,y)={1,0,yˆ=yyˆ≠y.
Portanto, a precisão não é uma regra de pontuação . É uma avaliação de classificação. (Este é um termo que acabei de inventar; não o procure na literatura.)
Agora, é claro que podemos ter uma previsão probabilística como a nossa q e transformá-lo em uma classificação y . Mas, para fazer isso, precisaremos das suposições adicionais mencionadas acima. Por exemplo, é muito comum usar um limite θ e classificar:qˆyˆθ
yˆ(qˆ,θ):={1,0,qˆ≥θqˆ<θ.
Um valor limite muito comum é . Note-se que se utilize este limiar e depois avaliar a precisão ao longo de muitos previsões q i (como acima) e os resultados correspondentes y i , em seguida, que chegam exactamente na perda de erros de classificação de acordo com Buja et al. Portanto, a perda de classificação incorreta também não é uma regra de pontuação, mas uma avaliação de classificação.θ=0.5qˆiyi
Se usarmos um algoritmo de classificação como o descrito acima, podemos transformar uma avaliação de classificação em uma regra de pontuação. O ponto é que precisamos das suposições adicionais do classificador. E essa precisão ou má classificação de perda ou qualquer outra avaliação de classificação que escolhemos pode, então, depender menos a previsão probabilística q e muito mais sobre a forma como transformar q em uma classificação y = y ( q , θ ) . Então otimizar a avaliação de classificação pode ser perseguindo um arenque vermelho, se estamos realmente interessados em avaliar q .qˆqˆyˆ=yˆ(qˆ,θ)qˆ
Agora, o que é impróprio sobre essas regras de pontuação sob suposições adicionais? Nada, no presente caso. Q = η , sob a implícita θ = 0,5 , irá maximizar a precisão e minimizar a perda de erros de classificação sobre todos os possíveis q ∈ ( 0 , 1 ) . Portanto, neste caso, nossas regras de pontuação sob suposições adicionais são adequadas.qˆ=ηθ=0.5qˆ∈(0,1)
yˆqˆ
qˆ≥θθ=0.5qˆ=0.99qˆ≥θqˆη
θ=0.2y=1y=0qˆqˆ=0.25qˆ≥θ
Portanto, a precisão ou perda de classificação incorreta pode ser enganosa.
Além disso, a precisão e a perda de classificação incorreta são impróprias sob as premissas adicionais em situações mais complexas em que os resultados não são reais. Frank Harrell, em seu blog Danos causados pela precisão da classificação e outras regras de pontuação de precisão inadequada e descontínua cita um exemplo de um de seus livros em que o uso de perda de precisão ou classificação incorreta levará a um modelo mal especificado, uma vez que eles não são otimizados pela previsão condicional correta probabilidade.
θ
Mais informações podem ser encontradas em Por que a precisão não é a melhor medida para avaliar modelos de classificação? .
A linha inferior
Não use precisão. Nem perda de classificação incorreta.
O nitpick: "estrito" vs. "estritamente"
Deveríamos estar falando sobre regras de pontuação apropriadas "estritas" ou sobre regras de pontuação apropriadas "estritamente"? "Estrito" modifica "adequado", não "regra de pontuação". (Existem "regras de pontuação apropriadas" e "regras de pontuação estritamente apropriadas", mas não "regras de pontuação estritas".) Como tal, "estritamente" deve ser um advérbio, não um adjetivo e "estritamente". Como é mais comum na literatura, por exemplo, os trabalhos de Tilmann Gneiting.