Portanto, estou tentando entender melhor os gráficos de Aumento e Ganho, conforme se aplica ao modelo de rotatividade de funcionários (ou seja, CHAID usado no SPSS Modeler). Para meus dados, isso significa prever o número de pessoas que voluntariamente deixam a empresa.
Eu revi as referências abaixo e tenho o básico sobre a interpretação: o que é plotado no eixo xey, e a curva ideal que você está procurando. Eu até pratiquei a construção de meus próprios ganhos e eleva gráficos no Excel.
Mas todos os exemplos que vi até agora são de uma campanha de mala direta. Agora, quero saber o que isso significa para meus dados. Significa apenas, no caso do gráfico de ganhos, que se eu amostrar 10% dos meus dados, posso esperar 40% dos termos versus a amostragem dos 60% superiores dos 80% dos meus dados? (suponha que 40% e 60% são os valores). Em caso afirmativo, que significado devo tirar disso, porque realmente não entendo no contexto do meu modelo de rotatividade?
Referências:
levantamento-medida-em-mineração de dados
http://www2.cs.uregina.ca/~dbd/cs831/notes/lift_chart/lift_chart.html
fonte
Respostas:
Às vezes, ajuda a imaginar o objetivo dessa análise e o que uma empresa pode fazer sem uma. Suponha que a empresa à qual os dados de rotatividade pertencem deseje fazer algo em relação a uma (possivelmente) alta taxa de rotatividade. Eu posso imaginar duas ações possíveis
Então, por que isso importa ?
As tabelas de elevação são principalmente importantes para o segundo caso de uso. Imagine o que uma empresa pode fazer quando decide investir dinheiro conversando com os funcionários 1 a 1, mas não possui um modelo? A única opção é conversar com todos ou com todos em uma amostra aleatória de tamanho fixo. Conversar com todos, apesar do ganho de identificar todos os participantes em potencial, é muito caro. Mas quando apenas uma amostra aleatória é selecionada para conversar, apenas uma fração de todos os participantes em potencial é identificada enquanto ainda gasta muito dinheiro. Nos dois casos, a relação custo-por-licença-prevenção é bastante alta.
Porém, quando existe um bom modelo, a empresa pode decidir falar apenas com os que têm maior probabilidade de sair (aqueles com os melhores resultados de acordo com o modelo), para que sejam identificados mais partidários em potencial, otimizando o custo por - deixar a prevenção .
Veja novamente as duas primeiras tabelas aqui: http://www2.cs.uregina.ca/~dbd/cs831/notes/lift_chart/lift_chart.html . Digamos que "clientes" = "funcionários" e "respondentes positivos" = "participantes em potencial" (veja os dados abaixo).
Se a empresa decidir que só pode gastar dinheiro suficiente para conversar com 10.000 funcionários, identificará
que significa
O eixo x em ambos os casos mostra a porcentagem de funcionários contatados, neste exemplo específico 10%.
Apêndice
Dados usados para tornar essa pergunta independente da podridão do link.
Taxa geral
Efetividade do modelo quando os funcionários são contatados em pedaços de 10000
fonte