Como criar um sistema de recomendação que integre a filtragem colaborativa e os recursos de conteúdo?

10

Estou criando um sistema de recomendação e quero incorporar as classificações de usuários "semelhantes" e os recursos dos itens. A saída é uma classificação prevista [0-1] .Estou considerando uma rede neural (para começar).

Portanto, as entradas são uma combinação dos recursos dos itens e as classificações de cada usuário. Para o item A e usuário 1, o sistema pode ser treinado nos dados combinados, A1. Este seria um exemplo de treinamento.

E se o usuário 1 também classificasse o filme B? Então os dados B1 também seriam um exemplo de treinamento? Existe um problema com a repetição do treinamento com os recursos do usuário 1 dessa maneira?

Você tem alguma sugestão sobre uma maneira melhor de abordar o problema?

B Seven
fonte

Respostas:

11

Por que você está considerando uma rede neural antes de entender completamente o problema?

Os métodos padrão de fatoração de matriz para filtragem colaborativa são capazes de aproveitar os recursos de conteúdo facilmente. Para um exemplo de como isso pode ser feito em uma configuração bayesiana, consulte o documento da Matchbox .

Alexandre Passos
fonte
6

Três artigos sobre a integração da fatoração matricial com os recursos de conteúdo (aqui, modelo de tópico especificamente):

  • Deepak Agarwal e Bee-Chung Chen. 2010. fLDA: fatoração da matriz através da alocação latente de dirichlet Em Anais da terceira conferência internacional da ACM sobre pesquisa na Web e mineração de dados (WSDM '10). ACM, Nova Iorque, NY, EUA, 91-100.
  • Hanhuai Shan e Arindam Banerjee. 2010. Fatorações matriciais probabilísticas generalizadas para filtragem colaborativa. Em Anais da Conferência Internacional IEEE de 2010 sobre Mineração de Dados (ICDM '10). IEEE Computer Society, Washington, DC, EUA, 1025-1030.
  • Chong Wang e David M. Blei. 2011. Modelagem de tópicos colaborativos para recomendar artigos científicos. Nas atas da 17ª conferência internacional da ACM SIGKDD sobre descoberta de conhecimento e mineração de dados (KDD '11). ACM, Nova Iorque, NY, EUA, 448-456.

Eu também promoveria minha própria entrada no blog que discute um pouco esse problema: os modelos de tópicos atendem aos modelos de fator de Lantent

Liangjie Hong
fonte
3

Não há necessidade de uma abordagem de rede neural, a filtragem colaborativa é um algoritmo em si mesma. Para o seu problema especificamente, há uma boa descrição do sistema cf e recomender em:

ml-class.org

(procure XVI: Sistemas de recomendação). É elegante, simples e, se você fizer certo (ou seja, usar forma vetorizada, minimizadores rápidos e gradientes preparados), poderá ser bastante rápido.

vonPetrushev
fonte
Eu usei essa abordagem, mas ela não usa os recursos dos itens. Gostaria de incluir recursos também.
B Sete