Estou tentando projetar uma técnica de fatoração matricial para um sistema simples de recomendação de itens de usuário. Eu tenho 2 perguntas sobre isso.
Primeiro, em uma implementação simples que vi da técnica de fatoração matricial para recomendação de filme, o autor acabou de inicializar as dimensões dos recursos latentes, vamos chamá-lo de K das duas matrizes de usuário e item do recurso latente, para um K constante, digamos 2 e, portanto, cada das matrizes de recursos latentes P e Q eram NXK e MXK, onde R é a matriz de classificação de itens do usuário original que estamos tentando aproximar com as dimensões NXM (N usuários e M itens). Portanto, minhas perguntas são: como determino o 'K' ideal (número de recursos latentes) nesse caso, em vez de apenas defini-lo como uma constante?
Também existe alguma maneira de incorporar informações de usuário ou item que eu já possuo no meu conjunto de dados, como a classificação média de um usuário em particular, sexo do usuário, localização do usuário etc. nesse resultado da fatoração da matriz ao fazer minha recomendação final (eu acho talvez um modelo de mesclagem com as informações de usuário e item representadas em algum outro modelo de filtragem baseado em conteúdo, juntamente com o meu modelo de fatoração de matriz funcionasse?).
1> Minha primeira pergunta é como determinar o número ideal de recursos latentes K 2> alguém conhece a literatura recente que implementa um modelo de fatoração matricial e filtragem baseada em conteúdo (porque acho que essa seria a única maneira de representar informações demográficas de usuários e itens em um espaço de recurso comum.)