O que os gráficos de elevação e ganho indicam no contexto de um modelo de rotatividade de funcionários

8

Portanto, estou tentando entender melhor os gráficos de Aumento e Ganho, conforme se aplica ao modelo de rotatividade de funcionários (ou seja, CHAID usado no SPSS Modeler). Para meus dados, isso significa prever o número de pessoas que voluntariamente deixam a empresa.

Eu revi as referências abaixo e tenho o básico sobre a interpretação: o que é plotado no eixo xey, e a curva ideal que você está procurando. Eu até pratiquei a construção de meus próprios ganhos e eleva gráficos no Excel.

Mas todos os exemplos que vi até agora são de uma campanha de mala direta. Agora, quero saber o que isso significa para meus dados. Significa apenas, no caso do gráfico de ganhos, que se eu amostrar 10% dos meus dados, posso esperar 40% dos termos versus a amostragem dos 60% superiores dos 80% dos meus dados? (suponha que 40% e 60% são os valores). Em caso afirmativo, que significado devo tirar disso, porque realmente não entendo no contexto do meu modelo de rotatividade?

Referências:

levantamento-medida-em-mineração de dados

gráfico do que é um elevador

http://www2.cs.uregina.ca/~dbd/cs831/notes/lift_chart/lift_chart.html

daniellopez46
fonte
1
Por que você está usando CHAID? Para o meu melhor entendimento, é um antigo método de classificação em árvore que antecede o CART e não possui muitas das boas propriedades estatísticas do CART.
Michael R. Chernick
(+1) por demonstrar esforço de pesquisa
steffen 27/07
@ Michael: Eu concordo, é um método mais antigo. Mas estou em uma posição em que estou colhendo os pedaços do que um analista anterior estava usando desde que ele deixou a empresa. Por enquanto estou apenas começando de onde ele parou. Eventualmente, quero começar a usar outros métodos e até conjuntos. @ Steffen - obrigado.
daniellopez46

Respostas:

8

Às vezes, ajuda a imaginar o objetivo dessa análise e o que uma empresa pode fazer sem uma. Suponha que a empresa à qual os dados de rotatividade pertencem deseje fazer algo em relação a uma (possivelmente) alta taxa de rotatividade. Eu posso imaginar duas ações possíveis

  1. Descubra o que está levando as pessoas a sair e consertar isso (falta de assistência médica? Sem espírito de equipe?) Em geral
  2. Encontre os funcionários que estão pensando em sair e conversar com eles, descobrindo o que os leva a resolver os problemas especificamente para eles.

Então, por que isso importa ?

As tabelas de elevação são principalmente importantes para o segundo caso de uso. Imagine o que uma empresa pode fazer quando decide investir dinheiro conversando com os funcionários 1 a 1, mas não possui um modelo? A única opção é conversar com todos ou com todos em uma amostra aleatória de tamanho fixo. Conversar com todos, apesar do ganho de identificar todos os participantes em potencial, é muito caro. Mas quando apenas uma amostra aleatória é selecionada para conversar, apenas uma fração de todos os participantes em potencial é identificada enquanto ainda gasta muito dinheiro. Nos dois casos, a relação custo-por-licença-prevenção é bastante alta.

Porém, quando existe um bom modelo, a empresa pode decidir falar apenas com os que têm maior probabilidade de sair (aqueles com os melhores resultados de acordo com o modelo), para que sejam identificados mais partidários em potencial, otimizando o custo por - deixar a prevenção .

Veja novamente as duas primeiras tabelas aqui: http://www2.cs.uregina.ca/~dbd/cs831/notes/lift_chart/lift_chart.html . Digamos que "clientes" = "funcionários" e "respondentes positivos" = "participantes em potencial" (veja os dados abaixo).

Se a empresa decidir que só pode gastar dinheiro suficiente para conversar com 10.000 funcionários, identificará

  • 2000010000010000=2000
  • 60001000010000=6000

que significa

  • 60002000=3
  • 10000(20000/100000)20000=10000100000=0.1

O eixo x em ambos os casos mostra a porcentagem de funcionários contatados, neste exemplo específico 10%.

Apêndice

Dados usados ​​para tornar essa pergunta independente da podridão do link.

Taxa geral

Total de funcionários contactados Identificadores
100000 20000

Efetividade do modelo quando os funcionários são contatados em pedaços de 10000

Total de funcionários contactados Identificadores
10000 6000
20000 10000
30000 13000
40000 15800
50000 17000
60000 18000
70000 18800
80000 19400
90000 19800
100000 20000
Steffen
fonte
english não é minha língua nativa e eu não gosto de usar "abandono". Qual é o termo correto aqui?
Steffen
Steffen, "abandono" é compreensível, mas "partida" pode ser mais convencional. O uso de "pego", no entanto, é um pouco chocante, porque essa palavra tem conotações de alguém preso por má conduta: um criminoso é "pego", mas o sujeito de um estudo é "identificado".
whuber
1
Steffen, o termo geral usado ao descrever a modelagem de rotatividade no gerenciamento de relacionamento com o cliente / análise de marketing é "Attriter". Isso se refere à noção de desgaste. Eu suspeitaria que esse termo fosse apropriado no mundo da análise de recursos humanos, mas não posso dizer com certeza.
22412 B_Miner
1
@ Whuber, sim, é um termo especializado. Também se refere ao atrito "duro" e "suave". O primeiro sendo tipicamente uma escolha proativa pelo cliente e o último sendo menos uma opção que a empresa poderia influenciar / intervir para corrigir. Por exemplo, alguns clientes são atrativos leves porque se movem, morrem ou são removidos pela empresa devido ao não pagamento. Em algumas modelagens de rotatividade usando análise de sobrevivência (normalmente em tempo discreto), riscos concorrentes são usados ​​para diferenciar essas causas de atrito.
B_Miner 27/07/12
1
Às vezes, o atrito suave também é usado para descrever um relacionamento que permanece tecnicamente "ativo", mas o cliente deixa de se envolver (por exemplo, ainda possui uma conta de cartão de crédito, mas não cobra nada em um determinado período).
22412 B_Miner