Precisão equilibrada vs pontuação F-1

14

Eu queria saber se alguém poderia explicar a diferença entre precisão equilibrada, que é

b_acc = (sensitivity + specificity)/2

e pontuação f1 que é:

f1 = 2*precision*recall/(precision + recall) 
dvreed77
fonte

Respostas:

19

Matematicamente, b_acc é a média aritmética de recall_P e recall_N ef é a média harmônica de recall_P e precision_P.

F1 e b_acc são métricas para avaliação do classificador, que (até certo ponto) lidam com o desequilíbrio de classe. Dependendo de qual das duas classes (N ou P) supera a outra, cada métrica é superior à outra.

1) Se N >> P, f1 é melhor.

2) Se P >> N, b_acc é melhor.

Claramente, se você pode mudar de rótulo, ambas as métricas podem ser usadas em qualquer um dos dois casos de desequilíbrio acima. Caso contrário, dependendo do desequilíbrio nos dados de treinamento, você pode selecionar a métrica apropriada.

Shashwat
fonte
1
Obrigado senhor, você tem uma referência para as informações sobre a escolha de Fscore vs precisão equilibrada em termos de número de classes positivas / negativas?
gin
Gostaria de responder ao pedido de @ gin de obter mais informações sobre como escolher entre os dois. Eu tenho alguns dados que onde N é de cerca de 8%. Pela resposta acima, parece que eu deveria usar a precisão equilibrada. Estive procurando outras referências sobre essa escolha (P> N -> b_acc), mas não vi nada.
precisa saber é o seguinte
Isso não faz nenhum sentido para mim. A precisão equilibrada é invariável sob a troca de etiquetas. Como você pode "melhorar" trocando de rótulo, se não for alterado?
TC Proctor