Como outras respostas afirmam corretamente, as probabilidades relatadas de modelos como regressão logística e Bayes ingênuo são estimativas da probabilidade de classe. Se o modelo fosse verdadeiro, a probabilidade seria de fato a probabilidade de uma classificação correta.
No entanto, é muito importante entender que isso pode ser enganoso, porque o modelo é estimado e, portanto, não é um modelo correto. Há pelo menos três questões.
- Incerteza das estimativas.
- Especificação incorreta do modelo.
- Viés.
A incerteza é apenas o fato presente em todos os lugares de que a probabilidade é apenas uma estimativa. Um intervalo de confiança da probabilidade estimada da classe pode fornecer alguma idéia sobre a incerteza (da probabilidade da classe, não da classificação).
--
Se o procedimento de estimativa (intencionalmente) fornecer uma estimativa tendenciosa , as probabilidades da classe estão erradas. Isso é algo que vejo nos métodos de regularização, como laço e cume, para regressão logística. Enquanto uma opção validada de validação cruzada leva a um modelo com bom desempenho em termos de classificação, as probabilidades de classe resultantes são claramente subestimadas (muito próximas a 0,5) nos casos de teste. Isso não é necessariamente ruim, mas é importante estar ciente.