Suponha que a população, da qual assumimos que você está amostrando aleatoriamente, contenha proporções de promotores, de passivos de detratores, com . Para modelar o NPS, imagine encher um chapéu grande com um grande número de tickets (um para cada membro da sua população) rotulado de para promotores, para passivos e para detratores, nas proporções dadas, e depois desenhar deles aleatoriamente. O NPS de amostra é o valor médio dos tickets que foram sorteados. O verdadeiro NPS é calculado como o valor médio de todos os tickets do chapéu: é op 0 p - 1 p 1 + p 0 + p - 1 = 1 + 1 0 - 1 np1p0 0p- 1p1+ p0 0+ p- 1= 1+ 10 0- 1nvalor esperado (ou expectativa ) do chapéu.
Um bom estimador do NPS verdadeiro é o NPS de amostra. O NPS de amostra também tem uma expectativa. Pode ser considerada a média de todos os NPSs possíveis da amostra. Essa expectativa é igual ao NPS verdadeiro. O erro padrão do NPS da amostra é uma medida de quanto os NPS da amostra geralmente variam entre uma amostra aleatória e outra. Felizmente, não precisamos calcular todas as amostras possíveis para encontrar o SE: ele pode ser encontrado mais simplesmente calculando o desvio padrão dos tickets no chapéu e dividindo por . (Um pequeno ajuste pode ser feito quando a amostra é uma proporção considerável da população, mas não é provável que seja necessário aqui.)n--√
Por exemplo, considere uma população de promotores, passivos detratores. O verdadeiro NPS ép 0 = 1 / 3 p - 1 = 1 / 6p1= 1 / 2p0 0= 1 / 3p- 1= 1 / 6
NPS = 1 × 1 / 2 + 0 × 1 / 3 + - 1 × 1 / 6 = 1 / 3.
A variação é, portanto,
Var (NPS)= ( 1 - NPS )2× p1+ ( 0 - NPS )2× p0 0+ ( - 1 - NPS )2× p- 1= ( 1 - 1 / 3 )2× 1 / 2 + ( 0 - 1 / 3 )2× 1 / 3 + ( - 1 - 1 / 3 )2× 1 / 6= 5 / 9.
O desvio padrão é a raiz quadrada disso, aproximadamente igual a0,75.
Em uma amostra de, digamos, , você esperaria observar um NPS em torno de % com um erro padrão de cerca de %.1 / 3 = 33 0,75 / √3241 / 3 = 334,10,75 / 324---√=4.1
De fato, você não conhece o desvio padrão dos tickets no chapéu, portanto o estima usando o desvio padrão da sua amostra. Quando dividido pela raiz quadrada do tamanho da amostra, estima o erro padrão do NPS: essa estimativa é a margem de erro (MoE).
Desde que você observe números substanciais de cada tipo de cliente (normalmente, cerca de 5 ou mais de cada um), a distribuição do NPS de amostra será próxima de Normal. Isso implica que você pode interpretar o MoE da maneira usual. Em particular, cerca de 2/3 do tempo em que o NPS da amostra fica dentro de um MoE do NPS verdadeiro e cerca de 19/20 do tempo (95%) o NPS da amostra fica a dois MoEs do NPS verdadeiro. No exemplo, se a margem de erro realmente fosse de 4,1%, teríamos 95% de confiança de que o resultado da pesquisa (o NPS da amostra) está dentro de 8,2% do NPS da população.
3.52+ 4.12---------√
Ao comparar muitos resultados da pesquisa ao longo do tempo, métodos mais sofisticados podem ajudar, porque você precisa lidar com muitas margens de erro separadas. Quando as margens de erro são todas muito semelhantes, uma regra básica é considerar uma alteração de três ou mais MoEs como "significativa". Neste exemplo, se os MoEs pairarem em torno de 4%, uma mudança de cerca de 12% ou mais durante um período de várias pesquisas deverá chamar sua atenção e alterações menores poderão ser validamente descartadas como erro de pesquisa. Independentemente disso, as análises e regras práticas fornecidas aqui geralmente fornecem um bom começo para pensar sobre o que as diferenças entre as pesquisas podem significar.
0 00 01 / n--√n
Você também pode usar o estimador de variância para variáveis contínuas. Na verdade, eu preferiria que o estimador de variância para a variável discreta aleatória, pois existe uma correção conhecida para calcular a variância da amostra: https://en.wikipedia.org/wiki/Unbially_estimation_of_standard_deviation Como outros observaram, a solução Whubers é baseado em fórmulas de população. No entanto, como você está executando uma pesquisa, tenho certeza de que você desenhou uma amostra, portanto, recomendo o uso do estimador imparcial (dividindo a soma dos quadrados por n-1, não apenas por n). Obviamente, para tamanhos de amostra grandes, a diferença entre o estimador enviesado e imparcial é praticamente inexistente.
Também recomendo usar um procedimento de teste t, se você tiver tamanhos médios de amostra, em vez de usar a abordagem do z-score: https://en.wikipedia.org/wiki/Student 's_t-test
@ whuber: já que outros perguntaram: como calcular o estimador de amostra imparcial para variância / sd para sua abordagem aleatória de variáveis discretas? Tentei encontrá-lo sozinho, mas não obtive sucesso. Obrigado.
fonte
Você pode usar o bootstrap para simplificar seus cálculos. Em R o código seria:
fonte