Considere uma matriz de entrada e uma saída binária .
Uma maneira comum de medir o desempenho de um classificador é usar curvas ROC.
Em um gráfico ROC, a diagonal é o resultado que seria obtido de um classificador aleatório. No caso de uma saída desequilibrada o desempenho de um classificador aleatório pode ser melhorado, escolhendo ou com probabilidades diferentes.
Como o desempenho desse classificador pode ser representado em um gráfico de curva ROC? Suponho que deveria ser uma linha reta com um ângulo diferente, e não a diagonal mais?
classification
roc
unbalanced-classes
Donbeo
fonte
fonte
Respostas:
As curvas ROC são insensíveis ao equilíbrio de classes. A linha reta que você obtém para um classificador aleatório agora já é o resultado do uso de diferentes probabilidades de produzir positivo (0 o leva a (0, 0) e 1 o leva a (1, 1) com qualquer intervalo entre eles).
Nada muda em um cenário desequilibrado.
fonte