Eu sei que a fórmula padrão para o IC de Bernoulli é:
Se como faço para estimar o intervalo de confiança quando é pequeno e ? Este caso reduziria a equação acima para , o que implica que o intervalo de confiança não melhora com maior .
Na minha opinião, o IC deve começar em [0,1] e o limite superior deve diminuir à medida que aumenta, dado que permanece em 0.
Respostas:
A razão pela qual o intervalo de confiança "CLT" usual se torna 0 é porque quando está muito próximo de 0 ou 1 (e o número relativo de amostras é baixo), o CLT se torna uma aproximação ruim. Isso ocorre porque quando , sua variável aleatória é constante. Por outro lado, quando está muito próximo de 1 ou 0, você precisa de uma quantidade muito grande de amostras para distinguir de exatamente 1 ou 0.p p=0,1 p p
Existem algumas abordagens para obter o verdadeiro intervalo de confiança. A maneira mais fácil é apelar para o intervalo de pontuação Wilson :
A segunda opção é estimar numericamente o verdadeiro intervalo de confiança usando explicitamente a distribuição binomial, em vez de apelar para a distribuição normal.
fonte