Se eu entendi corretamente, um intervalo de confiança de um parâmetro é um intervalo construído por um método que gera intervalos contendo o valor verdadeiro para uma proporção especificada de amostras. Portanto, a 'confiança' é mais sobre o método do que o intervalo que eu calculo de uma amostra específica.
Como usuário de estatísticas, sempre me senti enganado por isso, pois o espaço de todas as amostras é hipotético. Tudo o que tenho é uma amostra e quero saber o que essa amostra me diz sobre um parâmetro.
Esse julgamento está errado? Existem maneiras de observar intervalos de confiança, pelo menos em algumas circunstâncias, que seriam significativos para os usuários das estatísticas?
[Esta questão surge de segundos pensamentos após dissimular os intervalos de confiança em uma resposta math.se https://math.stackexchange.com/questions/7564/calculating-a-sample-size-based-on-a-confidence-level/7572 # 7572 ]
fonte
Uma abordagem alternativa relevante para o seu 2º Q, "Existem maneiras de observar intervalos de confiança, pelo menos em algumas circunstâncias, que seriam significativas para os usuários das estatísticas?":
Você deve dar uma olhada na inferência bayesiana e nos intervalos credíveis resultantes . Um intervalo credível de 95% pode ser interpretado como um intervalo que você acredita ter 95% de probabilidade de incluir o valor verdadeiro do parâmetro. O preço que você paga é que você precisa colocar uma distribuição de probabilidade anterior nos valores que acredita que o parâmetro verdadeiro provavelmente terá antes de coletar os dados. E seu prior pode diferir do prior de outra pessoa, portanto, seus intervalos credíveis resultantes também podem diferir mesmo quando você usa os mesmos dados.
Esta é apenas minha tentativa rápida e grosseira de resumir! Um bom livro recente com foco prático é:
Andrew Gelman, John B. Carlin, Hal S. Stern e Donald B. Rubin. "Bayesian Data Analysis" (2ª edição). Chapman & Hall / CRC, 2003. ISBN 978-1584883883
fonte
Penso que a premissa desta questão é falha porque nega a distinção entre o incerto e o conhecido .
A descrição de um lançamento de moeda fornece uma boa analogia. Antes que a moeda seja lançada, o resultado é incerto; depois, não é mais "hipotético". Confundir esse fato consumado com a situação real que desejamos entender (o comportamento da moeda, ou decisões a serem tomadas como resultado de seu resultado) nega essencialmente um papel de probabilidade na compreensão do mundo.
Esse contraste é lançado em grande relevo dentro de uma arena experimental ou regulatória. Nesses casos, o cientista ou o regulador sabem que serão confrontados com situações cujos resultados, a qualquer momento antes, são desconhecidos, mas devem fazer determinações importantes, como projetar o experimento ou estabelecer os critérios a serem usados para determinar a conformidade com os regulamentos. (para testes de drogas, segurança no local de trabalho, padrões ambientais etc.). Essas pessoas e as instituições para as quais trabalham precisam de métodos e conhecimento das características probabilísticas desses métodos , a fim de desenvolver estratégias ótimas e defensáveis, como bons projetos experimentais e procedimentos de decisão justos que cometerem o mínimo possível.
Intervalos de confiança, apesar de sua justificativa classicamente ruim, se encaixam nesse quadro teórico da decisão. Quando um método de construção de um intervalo aleatório possui uma combinação de boas propriedades, como garantir uma cobertura mínima esperada do intervalo e minimizar a duração esperada do intervalo - ambas propriedades a priori , e não a posteriori -, uma longa carreira de uso desse método, podemos minimizar os custos associados às ações indicadas por esse método.
fonte
Você está certo ao dizer que os intervalos de confiança de 95% são coisas resultantes do uso de um método que funciona em 95% dos casos, em vez de qualquer intervalo individual com 95% de probabilidade de conter o valor esperado.
"A base lógica e a interpretação dos limites de confiança são, mesmo agora, uma questão de controvérsia." {David Colquhoun, 1971, Palestras sobre Bioestatística}
Essa citação é retirada de um livro de estatística publicado em 1971, mas eu diria que ainda é verdade em 2010. A controvérsia é provavelmente mais extrema no caso de intervalos de confiança para proporções binomiais. Existem muitos métodos concorrentes para calcular esses intervalos de confiança, mas todos são imprecisos em um ou mais sentidos, e mesmo o método com pior desempenho tem proponentes entre os autores de livros didáticos. Mesmo os chamados intervalos "exatos" não produzem as propriedades esperadas dos intervalos de confiança.
Em um artigo escrito para cirurgiões (amplamente conhecido por seu interesse em estatística!), John Ludbrook e eu defendemos o uso rotineiro de intervalos de confiança calculados usando um anterior bayesiano uniforme, porque esses intervalos têm propriedades freqüentistas tão boas quanto qualquer outro método (em média exatamente 95% de cobertura sobre todas as proporções verdadeiras), mas, mais importante, uma cobertura muito melhor sobre todas as proporções observadas (exatamente 95% de cobertura). O artigo, devido ao seu público-alvo, não é muito detalhado e, portanto, pode não convencer todos os estatísticos, mas estou trabalhando em um artigo de acompanhamento com o conjunto completo de resultados e justificativas.
É um caso em que a abordagem bayesiana tem propriedades freqüentistas tão boas quanto a abordagem freqüentista, algo que acontece com bastante frequência. A suposição de um prior uniforme não é problemática, porque uma distribuição uniforme de proporções populacionais está embutida em todos os cálculos de cobertura freqüentista que encontrei.
Você pergunta: "Existem maneiras de observar intervalos de confiança, pelo menos em algumas circunstâncias, o que seria significativo para os usuários das estatísticas?" Minha resposta, então, é que, para intervalos binomiais de confiança, é possível obter intervalos que contêm a proporção da população exatamente 95% do tempo para todas as proporções observadas. Isso é um sim. No entanto, o uso convencional de intervalos de confiança espera cobertura para todas as proporções populacionais e, para isso, a resposta é "Não!"
A extensão das respostas à sua pergunta e as várias respostas sugerem que os intervalos de confiança são amplamente mal compreendidos. Se mudarmos nosso objetivo de cobertura para todos os valores de parâmetros verdadeiros para cobertura do valor de parâmetro verdadeiro para todos os valores de amostra, pode ficar mais fácil porque os intervalos serão modelados para serem diretamente relevantes aos valores observados, e não para o desempenho do método per se.
fonte
Esta é uma excelente discussão. Eu sinto que intervalos Bayesianos credíveis e intervalos de apoio à probabilidade são o caminho a percorrer, bem como as probabilidades Bayesianas posteriores de eventos de interesse (por exemplo, um medicamento é eficaz). Mas suplantar valores de P com intervalos de confiança é um grande ganho. Praticamente todas as edições dos melhores periódicos médicos, como NEJM e JAMA, têm um artigo com o problema "ausência de evidência não é evidência de ausência" em seus resumos. O uso de intervalos de confiança impedirá amplamente esses erros. Um excelente pequeno texto é http://www.amazon.com/Statistics-Confidence-Intervals-Statistical-Guidelines/dp/0727913751
fonte
Para responder à sua pergunta diretamente: Suponha que você esteja pensando em usar uma máquina para encher uma caixa de cereal com uma certa quantidade de cereal. Obviamente, você não deseja encher / encher demais a caixa. Você deseja avaliar a confiabilidade da máquina. Você realiza uma série de testes da seguinte forma: (a) Use a máquina para encher a caixa e (b) Meça a quantidade de cereal que é preenchida na caixa.
Usando os dados coletados, você constrói um intervalo de confiança para a quantidade de cereal que a máquina provavelmente preencherá na caixa. Esse intervalo de confiança nos diz que o intervalo que obtivemos tem uma probabilidade de 95% de conter a quantidade real de cereal que a máquina colocará na caixa. Como você diz, a interpretação do intervalo de confiança se baseia em amostras hipotéticas e não vistas geradas pelo método considerado. Mas, é exatamente isso que queremos em nosso contexto. No contexto acima, que vai usar a máquina várias vezes para encher a caixa e, portanto, nós nos preocupamos com hipotéticos realizações, invisíveis a quantidade de cereal os preenchimentos máquina na caixa.
Para abstrair do contexto acima: um intervalo de confiança nos garante que, se usarmos o método sob investigação (no método de exemplo acima = máquina) repetidamente, há uma probabilidade de 95% de que o intervalo de confiança tenha o parâmetro true .
fonte