Estou implementando um sistema de classificação para ser usado no meu site e acho que a média bayesiana é a melhor maneira de fazer isso. Cada item será classificado em seis categorias diferentes pelos usuários. Não quero que itens com apenas uma classificação alta atinjam o topo, e é por isso que quero implementar um sistema bayesiano.
Aqui está a fórmula:
Bayesian Rating = ( (avg_num_votes * avg_rating) + (this_num_votes * this_rating) ) / (avg_num_votes + this_num_votes)
Como os itens serão classificados em 6 categorias diferentes, devo usar a média das somas dessas categorias como "this_rating" para o sistema bayesiano? Por exemplo, considere um item com duas classificações (escala de 0 a 5):
Rating 1:
Category A: 3
Category B: 1
Category C: 2
Category D: 4
Category E: 5
Category F: 3
Sum: 18
Rating 2:
Category A: 2
Category B: 3
Category C: 3
Category D: 5
Category E: 0
Category F: 1
Sum: 14
"This_rating" deve ser simplesmente a média das somas listadas acima? Meu pensamento está correto, ou um sistema bayesiano também deve ser implementado para cada categoria (ou isso é exagero)?
Respostas:
Depende se você deseja terminar apenas com uma classificação cumulativa de cada objeto ou uma classificação específica de categoria. Ter um sistema separado em cada categoria parece mais realista, mas seu contexto específico pode sugerir o contrário. Você pode até fazer uma classificação geral e específica de categoria!
fonte