Qual é a melhor técnica para calcular um intervalo de confiança de um experimento binomial, se sua estimativa é de que (ou similarmente ) e o tamanho da amostra são relativamente pequenos, por exemplo ?
confidence-interval
binomial
Kasper
fonte
fonte
scipy.stats.beta.ppf(1−$\alpha$;x+1,n−x)
scipy.stats.beta.ppf(1−$\alpha$;x+1,n−x)
Respostas:
Não use a aproximação normal
Muito foi escrito sobre esse problema. Um conselho geral é nunca usar a aproximação normal (ou seja, o intervalo de confiança assintótico / Wald), pois possui propriedades de cobertura terríveis. Código R para ilustrar isso:
Para pequenas probabilidades de sucesso, você pode solicitar um intervalo de confiança de 95%, mas obter, por exemplo, um intervalo de confiança de 10%!
Recomendações
Então, o que devemos usar? Acredito que as recomendações atuais são as listadas no artigo Estimativa de intervalo para uma proporção binomial de Brown, Cai e DasGupta na Statistical Science 2001, vol. 16, n. 2, páginas 101–133. Os autores examinaram vários métodos para calcular intervalos de confiança e chegaram à seguinte conclusão.
O intervalo Wilson também é chamado de intervalo de pontuação , pois é baseado na inversão de um teste de pontuação.
Cálculo dos intervalos
Para calcular esses intervalos de confiança, você pode usar esta calculadora on-line ou a
binom.confint()
função nobinom
pacote em R. Por exemplo, para 0 sucessos em 25 tentativas, o código R seria:Aqui
bayes
está o intervalo de Jeffreys. (O argumentotype="central"
é necessário para obter o intervalo igual ).Observe que você deve decidir qual dos três métodos deseja usar antes de calcular o intervalo. Olhar para todos os três e selecionar o menor, naturalmente oferecerá uma probabilidade de cobertura muito pequena.
Uma resposta rápida e aproximada
Como nota final, se você observar exatamente zero sucessos em seu n ensaios e apenas desejar um intervalo de confiança aproximado muito rápido, poderá usar a regra de três . Simplesmente divida o número 3 por n . No exemplo acima, n é 25, então o limite superior é 3/25 = 0,12 (o limite inferior é, obviamente, 0).
fonte
bayes
usa o uniforme uniforme (em vez do de Jeffrey) quando os dois parâmetros de forma são 1. Enviei um e-mail para o mantenedor do pacote binom por curiosidade sobre as (des) vantagens do uniforme de Jeffrey vs. o uniforme anterior e ele me disse que uma nova versão usará o uniforme anterior como padrão. Portanto, não se pergunte se os resultados variam ligeiramente no futuro.binconf
métodoHmisc
também calcula esses intervalos. O padrão é o método Wilson.fonte