Na filtragem colaborativa, temos valores que não são preenchidos. Suponha que um usuário não assistiu a um filme, então precisamos colocar um 'na' nele.
Se eu for usar um SVD dessa matriz, preciso inserir um número - digamos 0. Agora, se eu fatorar a matriz, tenho um método para encontrar usuários semelhantes (descobrindo quais usuários estão mais próximos) o espaço dimensional reduzido). Mas a própria preferência prevista - de um usuário para um item será zero. (porque foi o que inserimos nas colunas desconhecidas).
Então, eu estou preso com o problema de filtragem colaborativa vs SVD. Eles parecem ser quase o mesmo, mas não exatamente.
Qual é a diferença entre eles e o que acontece quando aplico um SVD a um problema de filtragem colaborativa? Sim, e os resultados parecem aceitáveis em termos de encontrar usuários próximos, o que é ótimo, mas como?