RFM e modelagem de valor da vida útil do cliente em R

12

Alguém pode me dizer como fazer modelagem de recência, frequência e valor monetário (RFM) e modelagem de valor para cliente em R?

Além disso, alguém pode me indicar alguma literatura sobre isso?

Beta
fonte
1
você também pode olhar para o pacote BTYD em R. ou comprar até morrer. Eu acho que Bruce Hardie é um dos autores. Não tenho muita certeza.

Respostas:

10

Quanto às referências, o Data Mining Using RFM Analysis deve ajudar na terminologia e em outras referências.

Uma das maneiras mais simples (e populares) de modelar a probabilidade de resposta do cliente é usar a regressão logística com RFM como variáveis ​​explicativas (entre outras variáveis ​​disponíveis).

Para modelar o valor monetário, é possível regredir a receita diretamente no RFM (usando um modelo linear simples para iniciantes), o que geralmente é surpreendentemente bom. Modelos mais avançados / não lineares (como Random Forest ou Gradient Boosting Machine) são melhores que modelos lineares na minha experiência.

Outra abordagem popular é criar um modelo um pouco mais complexo para prever o valor monetário com base em dois submodelos: um para probabilidade de resposta (por exemplo, usando regressão logística como uma função do RFM) e outro para receita condicionada à resposta (novamente, pode ser tão simples quanto um modelo linear de RFM). O valor monetário esperado é o produto das duas previsões.

Se houver dados aleatórios de teste / controle disponíveis, as técnicas baseadas em aumento / levantamento líquido são bastante populares para modelar os benefícios incrementais de um tratamento.

Quanto ao valor do ciclo de vida do cliente, consulte Modelando o valor da vida útil do cliente para obter uma revisão e outras referências.

Com relação à modelagem no R, não conheço nenhum pacote "pronto para uso" para esse tipo de modelagem. O R fornece todos os componentes necessários para isso (a menos que você tenha uma quantidade enorme de dados - nesse caso, talvez seja necessário confiar em ferramentas mais escaláveis)

Yevgeny
fonte
1
Resposta muito boa, mas acho que o primeiro link pode estar quebrado.
Dimitriy V. Masterov
@ Yevgeny, tenho duas perguntas sobre as sugestões que você deu. Primeiro, quanto à modelagem do valor monetário, é correto regredir a receita usando Monetário entre as variáveis ​​preditoras? Receio que eles sejam a mesma variável. Em segundo lugar, você tem algum recurso on-line que possa me ajudar a entender como executar a regressão linear condicional à resposta (usando a segunda abordagem que você descreveu)? Muito obrigado!
nhern121
1) Tudo bem, desde que você não esteja confundindo as variáveis ​​explicativas / de entrada (dos dados anteriores) e a variável de destino (dos dados "futuros") 2) Basta escolher o subconjunto de dados em que os clientes compraram algo e regredir a receita as variáveis ​​explicativas
Yevgeny
5

Não tenho certeza se você ainda está trabalhando na modelagem de RFM. Aqui ( pdf ) está um artigo / a vinheta do pacote BTYD em R que pode ser útil para você. O artigo inteiro é baseado em R e tem 3 modelos diferentes para serem vistos. Na página 1, 2.1 Preparação de dados, você pode ver o contexto sobre RFMs.

afiado
fonte
Obrigado Gung! Mesmo que no momento eu não esteja trabalhando nisso. Mas isso é muito útil. Além disso, pode ser útil para outras pessoas que estão trabalhando nisso agora.
Beta