Entendo que a f-measure (com base na precisão e recall) é uma estimativa da precisão de um classificador. Além disso, a f-measure é favorecida à precisão quando temos um conjunto de dados desequilibrado. Eu tenho uma pergunta simples (que é mais sobre o uso de terminologia correta do que sobre tecnologia). Eu tenho um conjunto de dados desequilibrado e uso a medida f em meus experimentos. Estou prestes a escrever um artigo que NÃO é para uma conferência de aprendizado de máquina / mineração de dados. Por isso, posso me referir a f-measure como sinônimo de precisão neste contexto. Por exemplo, eu tenho uma medida f de 0,82, então posso dizer que meu classificador atinge 82% de previsões precisas?
10
Respostas:
Primeiro de tudo, acho a "precisão" algumas vezes um pouco enganadora, pois se refere a coisas distintas:
O termo precisão na genealogia para avaliar sistemas ou métodos (eu sou químico analítico) refere-se ao viés das previsões, ou seja, responde à pergunta de quão boas são as previsões em média.
O escore F é frequentemente introduzido como média harmônica de precisão e recordação (ou valor preditivo positivo e sensibilidade). Para sua pergunta, acho útil esclarecer um pouco mais e simplificá-lo:
A última expressão não é uma fração de nada que eu possa pensar como um determinado grupo de casos de teste. Em particular, é esperada uma sobreposição (pesada) entre os casos VERDADEIRO e POSITIVO. Isso me impediria de expressar uma pontuação-F como porcentagem, pois isso implica uma proporção de casos. Na verdade, acho que advertiria o leitor de que o F-score não tem essa interpretação.
fonte
Resposta rápida:
Não, a
F-measure
fórmula não consiste emTN
fator e é útil para recuperar problemas (doc) .Portanto, é (
F-measure
) a abordagem correta para avaliar os conjuntos de dados desequilibrados ou no caso de problemas de recuperação em vez deaccuracy
eROC
.[ NOTA ]:
fonte