Eu sou um engenheiro de software que procura criar uma ferramenta de teste A / B. Não tenho um histórico sólido de estatísticas, mas tenho lido bastante nos últimos dias.
Estou seguindo a metodologia descrita aqui e resumirei os pontos relevantes abaixo.
A ferramenta permitirá que designers e especialistas em domínio configurem um site para dividir o tráfego recebido em um URL específico entre dois ou mais URLs. Por exemplo, o tráfego que chega a http://example.com/hello1 pode ser dividido entre http://example.com/hello1 e http://example.com/hello2 . O tráfego seria dividido igualmente entre os URLs de destino e o desempenho dos processos de marketing em cada um dos URLs de destino será comparado.
Nesta experiência, o tamanho da amostra N
corresponderá aos visitantes. O teste medirá "conversões", um termo que descreve quando um visitante se compromete com uma ação específica em um processo de marketing. As conversões são expressas em porcentagens e uma taxa de conversão mais alta é desejável. Isso faz do teste uma comparação de proporções independentes. A ferramenta precisa ser capaz de ser facilmente empregada para produzir testes com resultados seguros. A seleção de um valor apropriado de N
é importante.
No artigo vinculado acima, uma análise de poder de duas proporções independentes é empregada para encontrar N
. Este método exige que se conheça a taxa de conversão do controle antecipadamente, bem como especifique a meta de melhoria de conversão desejada. Também especifica um nível de significância de 95% e um poder estatístico de 80%.
Questões:
- Este método é para determinar o
N
som? Em caso afirmativo, qual é a maneira mais segura de determinar a taxa de conversão do controle antes de iniciar o teste? - Existem formas sólidas de determinar
N
que não exijam que se conheça antecipadamente as taxas de conversão do controle? - A metodologia do artigo vinculado é sólida? Caso contrário, existem métodos acessíveis e facilmente digeríveis por aí aos quais você poderia me vincular?
IMHO, na medida em que vai, o post vai na direção certa. Contudo:
O método proposto faz implicitamente duas suposições: a taxa de conversão da linha de base e a quantidade esperada de alteração. O tamanho da amostra depende muito de como você cumpre essas premissas. Eu recomendo que você calcule os tamanhos de amostra necessários para várias combinações de p1 e p2 que você acha realistas. Isso dará a você uma idéia da confiabilidade do cálculo do tamanho da amostra.
Portanto, se a taxa de conversão real for 9% em vez de 10%, você precisará de mais 2000 casos para cada cenário para detectar a taxa de conversão de 10% acima da linha de base do novo formulário.
Após a conclusão do teste, você pode calcular intervalos de confiança para as proporções com base em suas observações reais.
sig.level
fonte
Em vez de calcular intervalos sobrepostos, você calcula o Z-score. Isso é algoritmicamente mais fácil de implementar e você obterá bibliotecas estatísticas para ajudá-lo.
Dê uma olhada: https://onlinecourses.science.psu.edu/stat200/node/53
fonte