Sistema de classificação bayesiano com várias categorias para cada classificação

Estou implementando um sistema de classificação para ser usado no meu site e acho que a média bayesiana é a melhor maneira de fazer isso. Cada item será classificado em seis categorias diferentes pelos usuários. Não quero que itens com apenas uma classificação alta atinjam o topo, e é por isso que quero implementar um sistema bayesiano.

Aqui está a fórmula:

Bayesian Rating = ( (avg_num_votes * avg_rating) + (this_num_votes * this_rating) ) / (avg_num_votes + this_num_votes)

Como os itens serão classificados em 6 categorias diferentes, devo usar a média das somas dessas categorias como "this_rating" para o sistema bayesiano? Por exemplo, considere um item com duas classificações (escala de 0 a 5):

Rating 1:
  Category A: 3
  Category B: 1
  Category C: 2
  Category D: 4
  Category E: 5
  Category F: 3
  Sum: 18

Rating 2:
  Category A: 2
  Category B: 3
  Category C: 3
  Category D: 5
  Category E: 0
  Category F: 1
  Sum: 14

"This_rating" deve ser simplesmente a média das somas listadas acima? Meu pensamento está correto, ou um sistema bayesiano também deve ser implementado para cada categoria (ou isso é exagero)?

bayesian James Skidmore
fonte

Pergunta interessante. Inicialmente, tive alguns problemas para entender seu pseudocódigo e depois li: thebroth.com/blog/118/bayesian-rating

Jeromy Anglim

Aqui está um link atualizado (viva para a Wayback Machine!).

Respostas:

Depende se você deseja terminar apenas com uma classificação cumulativa de cada objeto ou uma classificação específica de categoria. Ter um sistema separado em cada categoria parece mais realista, mas seu contexto específico pode sugerir o contrário. Você pode até fazer uma classificação geral e específica de categoria!

Aniko
fonte

Concordo. Além disso, dependendo do domínio, um composto ponderado de categorias pode ser um índice mais apropriado de uma classificação geral.

precisa saber é o seguinte

Obrigado pelos pensamentos Aniko. Vou dar uma olhada nisso nos próximos dias.

precisa