Para uma tarefa de análise de sentimentos, suponha que tenhamos algumas classes representadas por características .
Podemos representar a probabilidade condicional de cada classe como: que representa cada recurso e é a classe temos. , podemos representar Nossos antecedentes para cada classe são dados por: que:
é o número total de recursos em todas as classes.
representa o número de contagens desse recurso na classe .
é o número total de recursos da classe e
é o número total de recursos para todas as classes.
O meu entendimento do que foi dito acima está correto? Portanto, dadas essas probabilidades de para cada palavra, sou a ingênua suposição de bayes que as palavras são independentes, então simplesmente multiplico cada palavra em um documento para uma determinada classe, ou seja, para calcular que é o número de palavras no documento. Isso está correto?
Para realmente calcular numericamente a probabilidade condicional, basta fazer o seguinte:
A última parte da equação parece um pouco suspeita para mim, pois parece muito simples de calcular para uma probabilidade bastante complexa.
fonte