Comparação de proporções em duas amostras, estimativa do tamanho da amostra: R vs Stata

10

Comparação de proporções em duas amostras, estimativa do tamanho da amostra: R vs Stata

Obtive resultados diferentes para tamanhos de amostra, da seguinte maneira:

Em R

power.prop.test(p1 = 0.70, p2 = 0.85, power = 0.90, sig.level = 0.05)

Resultado: (so 161) para cada grupo.n=160.7777

Na Stata

sampsi 0.70 0.85, power(0.90) alpha(0.05)

Resultado: para cada grupo.n=174

Por que a diferença? Obrigado.

BTW, executei o mesmo cálculo de tamanho de amostra no SAS JMP , o resultado: (quase o mesmo que o resultado de R).n=160

dwstu
fonte

Respostas:

7

A diferença se deve ao fato de o sampsicomando do Stata (descontinuado no Stata 13 e substituído por power) usar a correção de continuidade por padrão, enquanto o R power.prop.test()não o usa (para obter detalhes sobre a fórmula usada pelo Stata, consulte duas proporções de potência do [PSS] ). Isso pode ser alterado com a nocontinuityopção, por exemplo,

sampsi 0.70 0.85, power(0.90) alpha(0.05) nocontinuity

que produz um tamanho de amostra de 161 por grupo. O uso da correção de continuidade produz um teste mais conservador (ou seja, tamanho maior da amostra) e obviamente é menos importante à medida que o tamanho da amostra aumenta.

Frank Harrell, na documentação de bpower(parte de seu pacote Hmisc ), destaca que a fórmula sem a correção da continuidade é bastante precisa, fornecendo assim uma justificativa para renunciar à correção.

Phil Schumm
fonte
2
Ótima resposta. Parece que não a diferença entre os dois métodos no meu post é a causa da diferença, mas o fato de um desses métodos estar usando a correção de continuidade e o outro não.
Michael M
11
Obrigado. Com apenas duas proporções (ou seja, uma tabela 2x2), não importa se você especifica a alternativa como duas proporções ou uma proporção e uma razão de chances. E como o Teste exato de Fisher é conservador para o problema binomial de duas amostras, as estimativas de energia baseadas nisso são mais próximas das da fórmula corrigida pela continuidade.
precisa
11
bsamsize(0.70, 0.85, alpha=0.05, power=0.90)n1 1=n2=160.7777