Realizei a classificação usando vários classificadores para dados rotulados de 2 classes e usei a validação cruzada 5 vezes. Para cada dobra calculei tp, tn, fp e fn. Então calculei a exatidão, precisão, recordação e pontuação F para cada teste. Minha pergunta é: quando quero calcular a média dos resultados, calculei a média das precisões, mas posso calcular a precisão, o recall e o F-score também? Ou isso seria matematicamente errado? PS Os conjuntos de dados usados em cada dobra são bem equilibrados em termos do número de instâncias por classe.
Obrigado.
Respostas:
O score, supondo que você esteja usando a definição usual, já é uma combinação de precisão e recall. Especificamente, é o meio harmônico deles. Em outras palavras, destina-se a capturar a 'eficácia' de um sistema em que o sistema o usuário coloca pesos iguais na precisão e no recall. Existe uma extensão, chamada pontuação , que dá vezes mais peso para recuperar do que precisão. Em Por outro lado, se você está perguntando se consegue calcular a média de 5F
Esteja ciente de que existem alguns problemas ao usar esses valores para fazer inferências sobre o erro de generalização dos classificadores. Por exemplo, um teste entre as pontuações de um classificador e as pontuações de outro classificador será otimista demais.t F F
fonte