Estou explorando opções para sistemas de recomendação otimizados para o setor de seguros, o que levaria em consideração
i) explorações de produtos
ii) características do usuário (segmento, idade, riqueza, etc.).
Eu quero enfatizar isso
a) não há classificações de produtos disponíveis, portanto a filtragem colaborativa não é uma opção
b) os produtos recomendados não precisam ser semelhantes aos produtos que já foram adquiridos; portanto, as recomendações item a item provavelmente não são relevantes.
Lembre-se de que, no seguro, você raramente deseja recomendar produtos semelhantes aos já adquiridos, pois é improvável que alguém do seguro de carro queira comprar outro produto Motor, em vez de Casa ou talvez Viagem, etc.
É por isso que desejo desenvolver recomendações sobre semelhanças entre os usuários com base em seu histórico de compras e / ou dados demográficos
Idealmente, eu gostaria de poder implementá-lo em R, se não for possível, em Python. Obrigado pela ajuda e sugestões!
fonte
Respostas:
Você pode usar a filtragem baseada em conteúdo, mas precisa pré-processar de forma inteligente os dados para extrair todo o conteúdo dos produtos. Além disso, isso pode levar a deixar alguns recursos. Este artigo é um excelente avanço depois que você pré-processa todos os dados.
Além disso, você pode fazer pseudo-classificações para produto versus cliente. Isso dependeria da sua declaração do problema. Algumas poucas sugestões podem ser o número de vezes que o cliente comprou o produto específico no último mês ou você também pode escolher um índice que defina com que frequência o cliente compra aquele produto que, matematicamente, seria last_two_purchases / interval_of_purchase ou também poderia levar uma média das últimas compras e intervalos.
Depois de fazer essa pseudo-classificação, você poderá converter todos os recursos baseados em conteúdo em números e usar o modelo de fator latente para filtragem colaborativa. Consulte este vídeo. Python pode ser usado para isso.
fonte
Errado. Você pode fazer a filtragem colaborativa com explorações. Basta usar os números / duração das participações em vez das classificações.
Qualquer abordagem baseada em conteúdo deve ser adequada. Posso ler um bom artigo chamado TrustWalker usando a confiança entre usuários (você cria links entre usuários semelhantes e propaga seus gostos na rede).
fonte