Intervalos de confiança são úteis?

11

Nas estatísticas freqüentistas, um intervalo de confiança de 95% é um procedimento de produção de intervalo que, se repetido um número infinito de vezes, conteria o parâmetro verdadeiro em 95% das vezes. Por que isso é útil?

Intervalos de confiança geralmente são mal compreendidos. Eles não são um intervalo em que podemos ter 95% de certeza de que o parâmetro está (a menos que você esteja usando o intervalo de credibilidade bayesiano semelhante). Intervalos de confiança parecem uma isca para mim.

O único caso de uso em que posso pensar é fornecer o intervalo de valores para o qual não podemos rejeitar a hipótese nula de que o parâmetro é esse valor. Os valores-p não forneceriam essas informações, mas melhor? Sem ser tão enganoso?

Em resumo: por que precisamos de intervalos de confiança? Como eles são, quando corretamente interpretados, úteis?

purpleostrich
fonte
O intervalo de credibilidade Bayesian é nem um intervalo que podemos ter 95% de certeza de que o parâmetro está em.
Sexto Empírico
@MartijnWeterings: a menos que você esteja 100% certo dos seus anteriores.
Xian
@ Xi'an que funciona quando um parâmetro tem 100% de certeza de ser razoavelmente considerado uma variável aleatória e um experimento é como amostrar a partir de uma distribuição de frequência conjunta , ou seja, você usa a regra de Bayes como: sem 'prior' explícito. Não é o mesmo para um parâmetro que é considerado fixo. Então, as crenças posteriores exigiriam que você também 'atualizasse' a antiga distribuição de frequência conjunta de e . É um pouco absurdo afirmar estar atualizando 'crenças anteriores', com 100% de certeza. P ( θ , x ) P ( θ | x ) = P ( θ , x ) / P ( x ) X θθP(θ,x)P(θ|x)=P(θ,x)/P(x)Xθ
Sextus Empiricus

Respostas:

10

Enquanto o intervalo de confiança for tratado como aleatório (ou seja, visto da perspectiva de tratar os dados como um conjunto de variáveis ​​aleatórias que ainda não vimos), poderemos realmente fazer declarações de probabilidade úteis sobre ele. Especificamente, suponha que você tenha um intervalo de confiança no nível para o parâmetro , e o intervalo tenha limites . Então podemos dizer que:1αθL(x)U(x)

P(L(X)θU(X)|θ)=1αfor all θΘ.

Mover-se para fora do paradigma freqüentista e marginalizar sobre para qualquer distribuição anterior fornece o resultado de probabilidade marginal correspondente (mais fraco):θ

P(L(X)θU(X))=1α.

Depois de fixarmos os limites do intervalo de confiança, fixando os dados em , não apelaremos mais para essa declaração de probabilidade, porque agora os dados foram corrigidos. No entanto, se o intervalo de confiança for tratado como um intervalo aleatório , poderemos realmente fazer esta declaração de probabilidade --- ou seja, com probabilidade o parâmetro cairá dentro do intervalo (aleatório).X=x1αθ

Nas estatísticas freqüentistas, declarações de probabilidade são declarações sobre frequências relativas em ensaios infinitamente repetidos. Mas isso é verdade para todas as afirmações de probabilidade do paradigma freqüentista; portanto, se sua objeção é às afirmações de frequência relativa, essa não é uma objeção específica aos intervalos de confiança. Se sairmos do paradigma freqüentista, poderemos dizer legitimamente que um intervalo de confiança contém seu parâmetro-alvo com a probabilidade desejada, desde que façamos essa declaração de probabilidade marginalmente (isto é, não condicional aos dados) e, assim, tratemos o intervalo de confiança no seu sentido aleatório.

Não conheço os outros, mas isso me parece um resultado de probabilidade bastante poderoso e uma justificativa razoável para essa forma de intervalo. Eu sou mais parcial com os métodos bayesianos, mas os resultados da probabilidade que correm os intervalos de confiança (no sentido aleatório) são resultados poderosos que não devem ser farejados.

Ben - Restabelecer Monica
fonte
1
"Sair do paradigma freqüentista" não é exatamente esse o problema? Em geral, queremos um intervalo que contenha o valor verdadeiro de um parâmetro de interesse com alguma probabilidade. Nenhuma análise freqüentista pode nos dar isso, e reinterpretá-la implicitamente como uma análise bayesiana leva a mal-entendidos. Melhor responder a pergunta diretamente através de um intervalo credível bayesiano. Existem usos para intervalos de confiança nos quais você realiza repetidamente "experimentos", por exemplo, controle de qualidade.
Dikran Marsupial
Não se trata de reinterpretar implicitamente como bayesiano (o último condicionaria os dados a obter um posterior). A resposta está apenas mostrando ao OP que podemos fazer declarações de probabilidade úteis sobre o intervalo de confiança. Quanto às objeções mais gerais ao paradigma freqüentista, essas são boas e boas, mas não são objeções específicas aos intervalos de confiança.
Ben - Restabelece Monica
1
Como você pode ver a partir das declarações de probabilidade acima, nós pode garantir que a CI contém o parâmetro com alguma probabilidade, enquanto olhamos para este a priori .
Ben - Restabelece Monica
1
Se você saiu do paradigma freqüentista, mas não está migrando para uma estrutura bayesiana, que estrutura é essa? Eu não estava expressando uma objeção ao frequentismo, acredito que você deve usar a estrutura que responde mais diretamente à pergunta que realmente deseja fazer. Confiança e intervalos credíveis respondem a perguntas diferentes.
Dikran Marsupial 31/01/19
1
@Dikran: A declaração de probabilidade permanece como está escrita e é uma declaração matemática pura. Realmente não vejo como você pode se opor a isso.
Ben - Restabelece Monica
5

Concordo com o @Ben acima, e pensei em fornecer um exemplo simples de onde um intervalo bayesiano versus um frequentista teria valor na mesma circunstância.

Imagine uma fábrica com linhas de montagem paralelas. É caro parar uma linha e, ao mesmo tempo, eles querem produzir produtos de qualidade. Eles estão preocupados com os falsos positivos e os negativos negativos ao longo do tempo. Para a fábrica, é um processo de média: tanto a potência quanto a proteção garantida contra falsos positivos são importantes. Intervalos de confiança, bem como intervalos de tolerância, são importantes para a fábrica. No entanto, as máquinas ficarão desalinhadas, isto é, , e o equipamento de detecção observará eventos espúrios. O resultado médio é importante, enquanto o resultado específico é um detalhe operacional.θΘ

Do outro lado, está um único cliente que compra um único produto ou um único lote de produtos. Eles não se importam com as propriedades de repetição da linha de montagem. Eles se preocupam com o único produto que compraram. Imaginemos que o cliente é a NASA e eles precisam que o produto atenda a uma especificação, digamos Eles não se importam com a qualidade das peças que não compraram. Eles precisam de um intervalo bayesiano de alguma forma. Além disso, uma única falha poderia matar muitos astronautas e custar bilhões de dólares. Eles precisam saber que cada peça comprada atende às especificações. A média seria mortal. Para um foguete Saturno V, uma taxa de um por cento de defeitos implicaria 10.000 peças defeituosas durante os voos da Apollo. Eles exigiram 0% de defeitos em todas as missões.γΓ.

Você se preocupa em ter um intervalo de confiança quando estiver trabalhando no espaço de amostra como uma fábrica está fazendo. Está criando o espaço de amostra. Você se preocupa com intervalos credíveis quando está trabalhando no espaço de parâmetros, como um cliente faria. Se você não se importa com as observações fora da sua, então você é bayesiano. Se você se importa com as amostras que não foram vistas, mas poderiam ter sido vistas, você é um freqüentista.

Você está preocupado com a média de longo prazo ou o evento específico?

Dave Harris
fonte
A NASA realmente compra peças com base em intervalos bayesianos? Eu entendo o seu argumento, mas eles realmente fazem isso?
Aksakal
@ Aksakal eu não sei. Juran, é claro, escreveu um trabalho maravilhoso sobre garantia de qualidade na NASA, mas não me lembro se o processo de teste foi discutido, pois já faz mais de uma década desde que eu o li. Sei que W Edwards Deming se opôs a intervalos de confiança em favor de intervalos credíveis, mas, novamente, isso não se refere diretamente. Meu palpite, e eu conheço pessoas que saberiam, mas é inconveniente perguntar no momento, é que eles usam métodos freqüentistas, porque é nisso que a maioria das pessoas é treinada. Você usa o martelo que possui.
Dave Harris
É o caso de "um martelo"? Talvez tenha algo a ver com a maneira como as coisas são na engenharia?
Aksakal
@ Aksakal Não estou qualificado para opinar sobre isso.
Dave Harris
Digamos que uma empresa produz partes, com um teste de hipótese composta no nível você os testou quanto a erros: deles passam sem erros e falham. Você pode dar à NASA uma garantia razoável. A quantidade máxima de produtos que podem passar no teste acidentalmente (considerados incorretamente sem erro) é . Sabendo que você vendeu itens, é possível calcular uma probabilidade máxima de que uma peça vendida não esteja de acordo com a hipótese alternativa . α H 0 : γ > Γ x y n α x γ ΓnαH0:γ>ΓxynαxγΓ
Sextus Empiricus
4

Observe que, pela definição estrita do intervalo de confiança, é possível que eles sejam completamente sem sentido, ou seja, não informativos sobre o parâmetro de interesse. No entanto, na prática, eles geralmente são muito significativos.

Como exemplo de um intervalo de confiança sem sentido, suponha que eu tenha um procedimento que 95% do tempo produz e 5% do tempo produz [ , ], onde é qualquer par de variáveis ​​aleatórias, como . Então este é um procedimento que captura qualquer probabilidade pelo menos 95% das vezes, portanto é tecnicamente um intervalo de confiança válido para qualquer probabilidade. No entanto, se eu disser que o intervalo produzido por esse procedimento foi de para um dado , você deve perceber que realmente não aprendeu nada sobre .[0,1]UminUmaxUmin,Umax U m i n < U m a x [ 0,01 , 0,011 ] p pUmin<Umax[0.01,0.011]pp

Por outro lado, a maioria dos intervalos de confiança é construída de uma maneira mais útil. Por exemplo, se eu lhe disser que foi criado usando um procedimento Wald Interval, sabemos que

p^ ˙ N(p,se)

onde é o erro padrão. Esta é uma afirmação muito significativa sobre como se relaciona com . Transformar isso em um intervalo de confiança é simplesmente uma tentativa de simplificar esse resultado para alguém que não está tão familiarizado com as distribuições normais. Isso também não significa apenas que é apenas uma ferramenta para pessoas que não sabem sobre distribuições normais; por exemplo, o bootstrap de percentil é uma ferramenta para resumir o erro entre o estimador e o parâmetro true quando a distribuição desse erro pode ser não gaussiana.sepp^p

Cliff AB
fonte
2

Intervalos de confiança não são apenas úteis, mas essenciais em alguns campos, como a física. Infelizmente, o maior ruído em relação às ICs vem dos bayesianos apanhados em falsos debates com os freqüentistas, geralmente no contexto de "ciências" sociais e outras disciplinas semelhantes à ciência.

Suponha que eu meça uma quantidade em Física, como carga de eletricidade. Eu sempre forneceria a medida da incerteza do valor, que geralmente é um desvio padrão. Como os erros de física geralmente são gaussianos, isso é traduzido diretamente para o IC. No entanto, quando os erros não são gaussianos, fica um pouco complicado, algumas integrais precisam ser avaliadas etc. Nada muito esotérico, embora geralmente.

Aqui está uma breve apresentação sobre o IC na física de partículas e a definição:

declaração quantitativa sobre a fração de vezes que esse intervalo conteria o valor verdadeiro do parâmetro em um grande número de experimentos repetidos

Observe que, na Física, "experimentos repetidos" geralmente têm um significado literal: supõe-se que você possa realmente repetir experimentos no artigo e realmente observe essa fração. Portanto, o IC tem um significado quase literal para você e é apenas uma maneira de expressar as informações sobre a incerteza da medição. Não é um experimento mental, nem uma opinião subjetiva, nem seus ou meus sentimentos sobre as probabilidades, etc.

Aksakal
fonte
1

Esse segmento evoluiu rapidamente para o debate Frequentista x Bayesiano, e isso não é facilmente solucionável. A matemática em ambas as abordagens é sólida, por isso sempre se resume a preferências filosóficas. A interpretação freqüentista da probabilidade como o limite da frequência relativa de um evento é justificada pela forte lei de grandes números; independentemente da sua interpretação preferida de probabilidade, a frequência relativa de um evento convergirá para sua probabilidade com probabilidade 1.

Intervalos de confiança freqüentistas são realmente mais difíceis de interpretar do que intervalos credíveis bayesianos. Ao tratar uma quantidade desconhecida como uma variável aleatória, os bayesianos podem afirmar que um intervalo contém essa quantidade com alguma probabilidade. Os freqüentistas se recusam a tratar algumas quantidades como variáveis ​​aleatórias, e quaisquer equações contendo apenas constantes só podem ser verdadeiras ou falsas. Portanto, ao estimar uma constante desconhecida, os freqüentadores devem vinculá-los a um intervalo aleatório para envolver a probabilidade. Em vez de um intervalo contendo uma variável aleatória com alguma probabilidade, um método frequentista gera muitos intervalos possíveis diferentes, alguns dos quais contêm a constante desconhecida. Se a probabilidade de cobertura for razoavelmente alta, é um salto de fé razoável afirmar que um intervalo específico contém a constante desconhecida (observe, não "

Um bayesiano recusaria tanto salto de fé quanto um freqüentista recusaria tratar qualquer quantidade desconhecida como uma variável aleatória. O método de construção frequentista de Neyman de fato expôs uma questão embaraçosa com tais saltos de fé. Sem evitá-lo ativamente (ver Feldman e Cousins, 1997, para uma abordagem), resultados raros podem gerar intervalos de confiança VAZIOS para um parâmetro de distribuição. Tal salto de fé seria muito irracional! Eu já vi alguns bayesianos usando esse exemplo para zombar de métodos freqüentistas, enquanto os freqüentadores geralmente respondem com "bem, ainda recebo um intervalo correto na maioria das vezes, e sem fazer suposições falsas". Vou apontar que o impasse bayesiano / freqüentista não é importante para a maioria dos que aplicam seus métodos.

BatWannaBe
fonte