Todos os valores dentro de um intervalo de confiança de 95% são igualmente prováveis?

56

Encontrei informações discordantes sobre a questão: " Se alguém constrói um intervalo de confiança de 95% (IC) de uma diferença de médias ou proporções, todos os valores dentro do IC são igualmente prováveis? Ou é a estimativa pontual a mais provável?" , com valores próximos às "caudas" do IC menos prováveis ​​do que aqueles no meio do IC?

Por exemplo, se um relatório de ensaio clínico randomizado afirmar que o risco relativo de mortalidade com um tratamento específico é 1,06 (IC 95% 0,96 a 1,18), a probabilidade de 0,96 ser o valor correto é igual a 1,06?

Encontrei muitas referências a esse conceito online, mas os dois exemplos a seguir refletem a incerteza:

  1. O módulo de Lisa Sullivan sobre intervalos de confiança afirma:

    Os intervalos de confiança para a diferença de médias fornecem uma faixa de valores prováveis ​​para ( ). É importante observar que todos os valores no intervalo de confiança são estimativas igualmente prováveis ​​do valor real de ( μ 1 - μ 2 ).μ1μ2μ1μ2

  2. Este post no blog, intitulado Dentro da margem do erro , declara:

    O que tenho em mente é entender mal a "margem de erro" que trata todos os pontos dentro do intervalo de confiança como igualmente prováveis, como se o teorema do limite central implicasse uma distribuição uniforme limitada em vez de uma distribuição t . [...]
    O que falamos sobre "margem de erro" perde é que as possibilidades próximas à estimativa pontual são muito mais prováveis ​​do que as possibilidades que estão no limite da margem ".

Estes parecem contraditórios, então qual é o correto?

pmgjones
fonte
7
Gostaria de saber se existe algum lugar confusão com o conceito relacionado de que os valores de p são uniformemente distribuídas sob a hipótese nula ..
Michael McGowan
4
A primeira cotação é um deslize aberrante em uma descrição precisa dos intervalos de confiança. A segunda citação é de um relato que, para dizer bem, é uma bagunça desleixada: está cheia de afirmações vagas, incorretas ou que só podem ser interpretadas no sentido bayesiano. Mas ambas as citações estão erradas !
whuber
@whuber Eu não chamaria o segundo uma confusão ... eu diria que é uma interpretação Bayesian da interpretação freqüentista :)
Michael McGowan
11
@ Michael Um exemplo de negligência é um solecismo como afirmar que o CLT implica em "um número infinito de estimativas repetidas da média [da população] ainda seguirá uma distribuição normal". Não é preciso estar errado para comunicar idéias simplesmente a um público não técnico.
whuber
2
@ Whuber, considero a frase que você cita apenas um pecado menor. O principal erro é que o CLT não envolve distribuição t.
vítreo

Respostas:

23

Uma pergunta que precisa ser respondida é o que "provável" significa nesse contexto?

Se isso significa probabilidade (como às vezes é usado como sinônimo de) e estamos usando definições freqüentes estritas, o valor verdadeiro do parâmetro é um valor único que não muda, então a probabilidade (probabilidade) desse ponto é 100% e todos outros valores são 0%. Portanto, quase todos são igualmente prováveis ​​em 0%, mas se o intervalo contiver o valor verdadeiro, será diferente dos outros.

Se usarmos uma abordagem bayesiana, o IC (Intervalo de credibilidade) provém da distribuição posterior e você pode comparar a probabilidade nos diferentes pontos do intervalo. A menos que o posterior seja perfeitamente uniforme dentro do intervalo (teoricamente possível, eu acho, mas isso seria uma circunstância estranha), então os valores terão probabilidades diferentes.

Se for provável que parecemos com a confiança, pense da seguinte maneira: calcule um intervalo de confiança de 95%, um intervalo de confiança de 90% e um intervalo de confiança de 85%. Estaríamos 5% confiantes de que o valor verdadeiro está na região dentro do intervalo de 95%, mas fora do intervalo de 90%, poderíamos dizer que o valor verdadeiro tem 5% de probabilidade de cair nessa região. O mesmo vale para a região que está dentro do intervalo de 90%, mas fora do intervalo de 85%. Portanto, se todo valor for igualmente provável, o tamanho das duas regiões acima precisaria ser exatamente o mesmo e o mesmo se aplicaria à região dentro de um intervalo de confiança de 10%, mas fora de um intervalo de confiança de 5%. Nenhuma das distribuições padrão que os intervalos são construídos usando possui essa propriedade (exceto casos especiais com 1 extraído de um uniforme).

Você pode provar isso para si mesmo simulando um grande número de conjuntos de dados de populações conhecidas, calculando o intervalo de confiança de interesse e comparando a frequência com que o parâmetro true está mais próximo da estimativa de pontos do que de cada um dos pontos finais.

Greg Snow
fonte
3
Probabilidade é o que essa pergunta precisa na resposta, não probabilidade, seja freqüentista ou bayesiana. A probabilidade fornece exatamente a resposta, os outros só podem fazê-lo com algumas torções e alongamentos.
Michael Lew
11
@ Greg Eu gosto da sua explicação. Só para esclarecer, seu argumento apóia a noção de que os valores nas "caudas" do IC de 95% são menos prováveis ​​(menos prováveis) do que aqueles mais próximos da estimativa pontual, correto? Obrigado pela sua resposta.
pmgjones
11
@pmgjones menos provável, NÃO, consulte o segundo parágrafo. Menos provável no contexto do quarto parágrafo, Sim.
Greg Neve
2
@GregSnow Seu segundo parágrafo diz quase exatamente que a probabilidade do parâmetro true ser o parâmetro true é 100%. Você realmente acredita que essa tautologia é o que "definições freqüentes estritas" têm a oferecer?
Rolando2
2
@ rolando2, acho que as estatísticas freqüentistas têm muito a oferecer, eu estava apenas eliminando as distorções comuns que implicam mudanças reais de valor e às vezes está fora do intervalo e às vezes dentro do intervalo (e às vezes mais perto dos limites e às vezes mais perto do Centro). Os parágrafos posteriores obtêm a sensação mais verdadeira das idéias.
Greg Neve
19

Esta é uma grande pergunta! Existe um conceito matemático chamado probabilidade que o ajudará a entender os problemas. Fisher inventou a probabilidade, mas a considerou um pouco menos desejável do que a probabilidade, mas a probabilidade acaba sendo mais "primitiva" do que a probabilidade, e Ian Hacking (1965) considerou axiomática por não ser comprovável. A probabilidade sustenta a probabilidade e não o contrário.

Hacking, 1965. Lógica da inferência estatística .

A probabilidade não recebe a atenção que deveria ter nos livros-padrão de estatística, sem uma boa razão. Difere da probabilidade de ter quase exatamente as propriedades que se esperaria, e as funções e intervalos de probabilidade são muito úteis para a inferência. Talvez a probabilidade não seja apreciada por alguns estatísticos, porque às vezes não há uma maneira "adequada" de derivar as funções relevantes da probabilidade. No entanto, em muitos casos, as funções de probabilidade são óbvias e bem definidas. Um estudo das probabilidades de inferência provavelmente deve começar com o livro pequeno e fácil de entender de Richard Royall, chamado Statistical Evidence: a Likelihood Paradigm .

A resposta para sua pergunta é que não, os pontos em qualquer intervalo nem todos têm a mesma probabilidade. Aqueles nas margens de um intervalo de confiança geralmente têm probabilidades mais baixas do que outras em direção ao centro do intervalo. Obviamente, o intervalo de confiança convencional não diz nada diretamente sobre o parâmetro relevante para o experimento específico. Os intervalos de confiança de Neyman são 'globais', pois são projetados para ter propriedades de longo prazo, em vez de propriedades 'locais' relevantes para o experimento em questão. (Um bom desempenho a longo prazo pode ser interpretado no local, mas isso é um atalho intelectual e não uma realidade matemática.) Intervalos de probabilidade - nos casos em que podem ser construídos - refletem diretamente a probabilidade de relacionar o experimento em questão.

Michael Lew
fonte
11
@suncoolsu Não é necessário que o intervalo em questão seja um intervalo de probabilidade para a afirmação ser verdadeira. O intervalo precisa abranger apenas a estimativa mais provável, para que os limites do intervalo sejam cada vez menos prováveis ​​que um ponto dentro do intervalo. Qualquer intervalo de confiança comum satisfará esse requisito.
Michael Lew
2
@pmjones Um IC 95% NÃO informa se os valores nas margens do IC estão mais próximos da verdade do que os valores no meio. Os ICs fazem declarações sobre amostragens repetidas da população. A longo prazo (ou seja, após amostragem repetida), 95% desses ICs, construídos para cada amostra, cobrirão o valor verdadeiro. Portanto, existem duas observações principais: 1) Não se pode dizer nada sobre o valor real de um determinado IC 2) Os ICs não informam nada sobre os dados observados, o que é uma crítica bayesiana usual.
suncoolsu
11
@MichaelLew O princípio de verossimilhança é útil, mas eu estava dizendo que (citando LW) "De fato, toda a inferência freqüentista viola o LP; portanto, se aderíssemos ao LP, teríamos que abandonar a inferência freqüentista". Como o IC é uma ideia freqüentista, ele viola o LP (que você diz ser fundamental).
suncoolsu
11
@suncollsu A questão não é se um intervalo de confiança sozinho e sem outras considerações estatísticas informa algo sobre a probabilidade de valores de parâmetros em si. É sobre a probabilidade de valores de parâmetros dentro do intervalo. A função de probabilidade responde à pergunta, e essa resposta está correta, mesmo que o intervalo de confiança viole o princípio da probabilidade. (Leia o meu comentário anterior novamente Você parece ter ignorado o seu conteúdo completo..)
Michael Lew
2
@ rolando2 Os intervalos de confiança de 95% de Neyman são projetados para que o método contenha o parâmetro true em 95% das ocasiões em que o método é usado. Estritamente falando, a confiança atribui ao método e não a qualquer intervalo individual e, portanto, o intervalo individual não diz nada sobre o estado do mundo nessa experiência em particular. Veja a minha resposta a esta pergunta para obter mais detalhes: stats.stackexchange.com/questions/8844/…
Michael Lew
18

Suponha que alguém me disse que eu deveria confiar igualmente em todos os valores dentro de um IC95 como indicadores potenciais do valor da população. (Evito deliberadamente os termos "provável" e "provável".) O que há de especial em 95? Nada: para ser consistente, eu também teria que depositar confiança igual em todos os valores dentro de um CI96, um CI97, ... e um CI99.9999999. À medida que a cobertura do IC chegava ao limite, praticamente todos os números reais precisavam ser incluídos. O absurdo dessa conclusão me levaria a rejeitar a afirmação inicial.

rolando2
fonte
4
Esta é uma ótima resposta! Eu deveria ter pensado no efeito de abordar extremos de possíveis ICs. Obrigado por escrever isso!
precisa saber é
2

Vamos começar com a definição de um intervalo de confiança. Se eu disser que um intervalo de confiança de 95% passa disso para isso, quero dizer que declarações dessa natureza serão verdadeiras cerca de 95% das vezes e falsas cerca de 5% das vezes. Eu não significa necessariamente que eu sou 95% confiante sobre este particular comunicado. Um intervalo de confiança de 90% será mais estreito e 80% ainda mais estreito. Portanto, ao me perguntar qual é o verdadeiro valor, tenho menos credibilidade nos valores à medida que eles se aproximam cada vez mais da margem de qualquer intervalo de confiança específico.

Observe que todas as opções acima são qualitativas, especialmente "credibilidade". (Evitei o termo "confiança" ou "probabilidade" nessa declaração porque eles carregam bagagem matemática que pode diferir da nossa bagagem intuitiva.) As abordagens bayesianas reformulariam sua pergunta para algo que tenha uma resposta quantitativa, mas não quero abrir essa lata de vermes aqui.

O texto clássico de Box, Hunter & Hunter ("Statistics for Experimenters", Wiley, 1978) também pode ajudar. Veja "Conjuntos de Intervalos de Confiança" na p. 113, ss.

Emil Friedman
fonte
Como estamos lidando parcialmente com conceitos e parcialmente semântica, mostrarei que em sua segunda frase você disse "... afirmações dessa natureza serão verdadeiras ..." sem especificar quais afirmações seriam verdadeiras.
Rolando2