Considere um experimento que produz uma taxa entre 0 e 1. Como essa taxa é obtida não deve ser relevante nesse contexto. Foi elaborado em uma versão anterior desta pergunta , mas removida para maior clareza após uma discussão sobre a meta .
Esse experimento é repetido vezes, enquanto é pequeno (cerca de 3-10). O são assumidos como sendo independente e identicamente distribuído. A partir disso, estimamos a média calculando a média , mas como calcular um intervalo de confiança correspondente ?
Ao usar a abordagem padrão para calcular intervalos de confiança, às vezes é maior que 1. No entanto, minha intuição é que o intervalo de confiança correto ...
- ... deve estar dentro do intervalo 0 e 1
- ... deve ficar menor com o aumento
- ... é da ordem do calculado usando a abordagem padrão
- ... é calculado por um método matematicamente correto
Esses não são requisitos absolutos, mas eu gostaria de entender pelo menos por que minha intuição está errada.
Cálculos com base em respostas existentes
A seguir, os intervalos de confiança resultantes das respostas existentes são comparados para .
Abordagem padrão (também conhecida como "Matemática escolar")
,σ2=0,0204, portanto, o intervalo de confiança de 99% é[0,865,1,053] . Isso contradiz a intuição 1.
Recorte (sugerido por @soakley nos comentários)
É fácil usar apenas a abordagem padrão e fornecer como resultado. Mas podemos fazer isso? Ainda não estou convencido de que o limite inferior permaneça constante (-> 4.)
Modelo de Regressão Logística (sugerido por @Rose Hartman)
Dados transformados: Resultando em [ 0,173 , 7,87 ] , transformando-o novamente resulta em [ 0,543 , 0,999 ] . Obviamente, o 6,90 é um valor externo para os dados transformados, enquanto o 0,99 não é para os dados não transformados, resultando em um intervalo de confiança muito grande. (-> 3.)
Intervalo de confiança da proporção binomial (sugerido por @Tim)
A abordagem parece muito boa, mas infelizmente não se encaixa no experimento. Basta combinar os resultados e interpretá-los como um grande experimento repetido de Bernoulli, conforme sugerido por @ZahavaKor, resulta no seguinte:
de 5 * 1000 no total. Alimentando isso no Ajuste. A calculadora Wald fornece [ 0,9511 , 0,9657 ] . Este não parece ser realista, porque não um único X i está dentro desse intervalo! (-> 3.)
Bootstrapping (sugerido por @soakley)
Com , temos 3125 permutações possíveis. Tomando o 3093média das permutações, obtemos[0,91,0,99]. Looks nãoqueruim, embora eu esperaria um intervalo maior (-> 3.). No entanto, é por construção nunca maior que[min(Xi),max(X . Assim, para uma amostra pequena, ela crescerá mais do que diminuirá para aumentar n (-> 2.). Isso é pelo menos o que acontece com as amostras fornecidas acima.
fonte
Respostas:
Primeiro, para esclarecer, o que você está lidando não é uma distribuição binomial, como sugere sua pergunta (você se refere a ela como um experimento de Bernoulli). As distribuições binomiais são discretas - o resultado é sucesso ou fracasso. Seu resultado é uma proporção sempre que você executa sua experiência , não um conjunto de sucessos e falhas nos quais você calcula uma proporção de resumo. Por esse motivo, os métodos para calcular um intervalo de confiança de proporção binomial descartarão muitas das suas informações. E, no entanto, você está certo de que é problemático tratar isso como se fosse distribuído normalmente, pois você pode obter um IC que ultrapassa o intervalo possível de sua variável.
Eu recomendo pensar sobre isso em termos de regressão logística. Execute um modelo de regressão logística com sua variável de proporção como resultado e sem preditores. A interceptação e seu IC fornecerão o que você precisa em logits e, em seguida, você poderá convertê-lo novamente em proporções. Você também pode fazer a conversão logística, calcular o IC e depois voltar à escala original. Meu python é terrível, mas eis como você pode fazer isso no R:
Aqui estão os limites inferior e superior em um IC de 99% para estes dados:
fonte
Você pode tentar reamostrar / inicializar. Vejamos o caso simples que você mencionou.
Com 3 pontos de dados de 0,99, 0,94 e 0,94, você nem faria a reamostragem porque pode listar todas as 27 permutações possíveis, encontrar a média em cada caso e depois classificar as médias.
A questão aqui: como criamos um intervalo de confiança para o parâmetro de um teste de permutação? fornece mais detalhes, incluindo algum código R.
fonte
Intervalos binomiais de confiança têm sido objeto de debates estatísticos há muito tempo. Seu problema considera uma taxa inferior a 100%, mas se torna ainda mais problemático se usarmos 100%. Uma maneira perspicaz de fazer a pergunta é:
Existem vários métodos para calcular essas caudas. Eu recomendo verificar a Wikipedia para obter as contas, ou, se você quiser apenas a resposta, procure uma calculadora de intervalo binomial como esta (que também tem mais explicações sobre a matemática por trás disso).
fonte
Uma abordagem bayesiana:
Encontre a distribuição beta exclusivaB que é induzido pelos experimentos (e um anterior, por exemplo, o anterior de Jeffreys), e depois escolhe o menor intervalo para o qual B A densidade de se integra à sua "confiança" desejada. É possível que haja várias soluções e, dependendo do seu anterior, a proporção média pode não estar no seu intervalo.
fonte