Digamos que eu queira saber qual o tamanho da amostra necessário para um experimento em que estou procurando determinar se a diferença nas duas proporções de sucesso é estatisticamente significativa. Aqui está o meu processo atual:
- Veja os dados históricos para estabelecer previsões de linha de base. Diga que, no passado, executar uma ação resulta em uma taxa de sucesso de 10%, enquanto não executar uma ação resulta em uma taxa de sucesso de 9%. Suponha que essas conclusões não tenham sido validadas estatisticamente, mas que sejam baseadas em quantidades relativamente grandes de dados (mais de 10.000 observações).
Conecte essas suposições ao arquivo power.prop.test para obter o seguinte:
power.prop.test(p1=.1,p2=.11,power=.9) Two-sample comparison of proportions power calculation n = 19746.62 p1 = 0.1 p2 = 0.11 sig.level = 0.05 power = 0.9 alternative = two.sided
Portanto, isso me diz que eu precisaria de um tamanho de amostra de ~ 20000 em cada grupo de um teste A / B para detectar uma diferença significativa entre proporções.
O próximo passo é realizar o experimento com 20.000 observações em cada grupo. O Grupo B (nenhuma ação tomada) possui 2300 sucessos em 20.000 observações, enquanto o Grupo A (ação tomada) possui 2200 sucessos em 20.000 observações.
Faça um teste
prop.test(c(2300,2100),c(20000,20000)) 2-sample test for equality of proportions with continuity correction data: c(2300, 2100) out of c(20000, 20000) X-squared = 10.1126, df = 1, p-value = 0.001473 alternative hypothesis: two.sided 95 percent confidence interval: 0.003818257 0.016181743 sample estimates: prop 1 prop 2 0.115 0.105
Então dizemos que podemos rejeitar a hipótese nula de que as proporções são iguais.
Questões
- Esse método está correto ou pelo menos está no caminho certo?
- Eu poderia especificar
alt="greater"
no prop.test e confiar no valor de p, mesmo que o power.prop.test fosse para um teste de dois lados? - E se o valor de p fosse maior que 0,05 no teste de teste? Devo assumir que tenho uma amostra estatisticamente significativa, mas não há diferença estatisticamente significativa entre as duas proporções? Além disso, a significância estatística é inerente ao valor de p em prop.test - ou seja, power.prop.test é necessário?
- E se eu não puder fazer uma divisão 50/50 e precisar fazer, por exemplo, uma divisão 95/5? Existe um método para calcular o tamanho da amostra para este caso?
- E se eu não tiver idéia de qual deve ser minha previsão de linha de base para proporções? Se eu acho e as proporções reais estão muito distantes, isso invalidará minha análise?
Quaisquer outras lacunas que você pudesse preencher seriam muito apreciadas - minhas desculpas pela natureza complicada deste post. Obrigado!
>
no início do bloco citado) em vez de apenas colocá-lo em negrito.