Correção da continuidade de Yates no intervalo de confiança retornado por prop.test

8

Este é o intervalo de confiança estimado por prop.test

n <- 600; x <- 276; p <- 0.40
prop.test(x, n, p, alternative="two.sided", conf.level=0.95, correct=T)
95 percent confidence interval:
 0.4196787 0.5008409 

Tentei reproduzi-lo, lendo o código em prop.test. Aqui está uma maneira simplificada de obter esses dois limites

ESTIMATE <- x/n
YATES <- 0.5
conf.level <- 0.95
z <- qnorm((1 + conf.level)/2)
YATES <- min(YATES, abs(x - n * p)) 
z22n <- z^2/(2 * n)
p.c <- ESTIMATE + YATES/n
(p.c + z22n + z * sqrt(p.c * (1 - p.c)/n + z22n/(2 * n)))/(1 + 2 * z22n)
[1] 0.5008409
p.c <- ESTIMATE - YATES/n
(p.c + z22n - z * sqrt(p.c * (1 - p.c)/n + z22n/(2 * n)))/(1 + 2 * z22n)
[1] 0.4196787

Você pode me explicar por que a probabilidade subjacente de sucesso (p) é usada na linha 5? ou talvez você possa sugerir onde posso encontrar mais informações sobre essa correção do YATES que afeta o ESTIMATE.

Obrigado

George Dontas
fonte

Respostas:

3

A página de ajuda indica que "A correção de continuidade é usada apenas se não exceder a diferença entre amostra e proporções nulas em valor absoluto". É isso que a linha 5 está verificando: x/né a proporção empírica, pé a proporção nula. (Na verdade, acho o "se" um pouco enganador, pois é mais um "na medida em que não excede" ao olhar para a linha 5.)

caracal
fonte
7

Na segunda questão de onde você pode encontrar mais informações sobre essa correção de continuidade (atribuída a Yates na ajuda para, prop.testmas não nas referências abaixo, acho que Yates propôs originalmente uma correção de continuidade apenas para o teste do qui-quadrado para tabelas de contingência ) :

  1. Newcombe RG. Intervalos de confiança bilaterais para a proporção única: comparação de sete métodos. Stat Med 1998; 17 (8): 857-872. PMID: 9595616

  2. Brown LD, Cai TT, DasGupta A. Estimativa de intervalo para uma proporção binomial (com Comentários e tréplica). Ciência Estatística 2001; 16 (2): 101-133. doi: 10.1214 / ss / 1009213286

O intervalo de pontuação de Wilson corrigido pela continuidade é 'método 4' em Newcomb. Brown et al. considere apenas o intervalo de pontuação de Wilson não corrigido no texto principal, mas George Casella sugere o uso da versão com correção de continuidade em seu Comment (p121), que Brown et al. discutir em sua tréplica (p130):

Casella sugere a possibilidade de executar uma correção de continuidade na estatística de pontuação antes de construir um intervalo de confiança. Não concordamos com esta proposta de nenhuma perspectiva. Esses intervalos "Wilson corrigidos para continuidade" têm propriedades de cobertura extremamente conservadoras, embora em princípio não seja garantido que eles sejam conservadores em todos os lugares. Mas mesmo que o objetivo de alguém, diferentemente do nosso, seja produzir intervalos conservadores, esses intervalos serão muito ineficientes em seu nível normal em relação a Blyth-Still ou mesmo Clopper-Pearson.

O intervalo 'exato' de Clopper-Pearson é fornecido binom.testem R. Eu sugeriria usá-lo, e não prop.testse você quiser um intervalo conservador, ou seja, um que garanta pelo menos 95% de cobertura. Se você preferir um intervalo que tenha cobertura próxima a 95% em média (acima de p) e, portanto, muitas vezes seja mais estreito, use prop.test(…, correct=FALSE)o intervalo de pontuação Wilson não corrigido.

O manual padrão para tais assuntos é o Métodos Estatísticos da Fleiss para Taxas e Proporções . Newcomb faz referência à edição original de 1981, mas a edição mais recente é a 3ª (2003) . Eu ainda não verifiquei.

uma parada
fonte
2
Outra referência para a comparação de ICs binomiais é Brown LD, Cai TT e DasGupta, A. (2001). Estimativa de intervalo para uma proporção binomial. Statistical Science, 16 (2), 101-133. projecteuclid.org/euclid.ss/1009213286 (acesso aberto). O binompacote de R também possui o Agresti-Coull CI.
Caracal