Encontrei informações discordantes sobre a questão: " Se alguém constrói um intervalo de confiança de 95% (IC) de uma diferença de médias ou proporções, todos os valores dentro do IC são igualmente prováveis? Ou é a estimativa pontual a mais provável?" , com valores próximos às "caudas" do IC menos prováveis do que aqueles no meio do IC?
Por exemplo, se um relatório de ensaio clínico randomizado afirmar que o risco relativo de mortalidade com um tratamento específico é 1,06 (IC 95% 0,96 a 1,18), a probabilidade de 0,96 ser o valor correto é igual a 1,06?
Encontrei muitas referências a esse conceito online, mas os dois exemplos a seguir refletem a incerteza:
O módulo de Lisa Sullivan sobre intervalos de confiança afirma:
Os intervalos de confiança para a diferença de médias fornecem uma faixa de valores prováveis para ( ). É importante observar que todos os valores no intervalo de confiança são estimativas igualmente prováveis do valor real de ( μ 1 - μ 2 ).
Este post no blog, intitulado Dentro da margem do erro , declara:
O que tenho em mente é entender mal a "margem de erro" que trata todos os pontos dentro do intervalo de confiança como igualmente prováveis, como se o teorema do limite central implicasse uma distribuição uniforme limitada em vez de uma distribuição t . [...]
O que falamos sobre "margem de erro" perde é que as possibilidades próximas à estimativa pontual são muito mais prováveis do que as possibilidades que estão no limite da margem ".
Estes parecem contraditórios, então qual é o correto?
fonte
Respostas:
Uma pergunta que precisa ser respondida é o que "provável" significa nesse contexto?
Se isso significa probabilidade (como às vezes é usado como sinônimo de) e estamos usando definições freqüentes estritas, o valor verdadeiro do parâmetro é um valor único que não muda, então a probabilidade (probabilidade) desse ponto é 100% e todos outros valores são 0%. Portanto, quase todos são igualmente prováveis em 0%, mas se o intervalo contiver o valor verdadeiro, será diferente dos outros.
Se usarmos uma abordagem bayesiana, o IC (Intervalo de credibilidade) provém da distribuição posterior e você pode comparar a probabilidade nos diferentes pontos do intervalo. A menos que o posterior seja perfeitamente uniforme dentro do intervalo (teoricamente possível, eu acho, mas isso seria uma circunstância estranha), então os valores terão probabilidades diferentes.
Se for provável que parecemos com a confiança, pense da seguinte maneira: calcule um intervalo de confiança de 95%, um intervalo de confiança de 90% e um intervalo de confiança de 85%. Estaríamos 5% confiantes de que o valor verdadeiro está na região dentro do intervalo de 95%, mas fora do intervalo de 90%, poderíamos dizer que o valor verdadeiro tem 5% de probabilidade de cair nessa região. O mesmo vale para a região que está dentro do intervalo de 90%, mas fora do intervalo de 85%. Portanto, se todo valor for igualmente provável, o tamanho das duas regiões acima precisaria ser exatamente o mesmo e o mesmo se aplicaria à região dentro de um intervalo de confiança de 10%, mas fora de um intervalo de confiança de 5%. Nenhuma das distribuições padrão que os intervalos são construídos usando possui essa propriedade (exceto casos especiais com 1 extraído de um uniforme).
Você pode provar isso para si mesmo simulando um grande número de conjuntos de dados de populações conhecidas, calculando o intervalo de confiança de interesse e comparando a frequência com que o parâmetro true está mais próximo da estimativa de pontos do que de cada um dos pontos finais.
fonte
Esta é uma grande pergunta! Existe um conceito matemático chamado probabilidade que o ajudará a entender os problemas. Fisher inventou a probabilidade, mas a considerou um pouco menos desejável do que a probabilidade, mas a probabilidade acaba sendo mais "primitiva" do que a probabilidade, e Ian Hacking (1965) considerou axiomática por não ser comprovável. A probabilidade sustenta a probabilidade e não o contrário.
Hacking, 1965. Lógica da inferência estatística .
A probabilidade não recebe a atenção que deveria ter nos livros-padrão de estatística, sem uma boa razão. Difere da probabilidade de ter quase exatamente as propriedades que se esperaria, e as funções e intervalos de probabilidade são muito úteis para a inferência. Talvez a probabilidade não seja apreciada por alguns estatísticos, porque às vezes não há uma maneira "adequada" de derivar as funções relevantes da probabilidade. No entanto, em muitos casos, as funções de probabilidade são óbvias e bem definidas. Um estudo das probabilidades de inferência provavelmente deve começar com o livro pequeno e fácil de entender de Richard Royall, chamado Statistical Evidence: a Likelihood Paradigm .
A resposta para sua pergunta é que não, os pontos em qualquer intervalo nem todos têm a mesma probabilidade. Aqueles nas margens de um intervalo de confiança geralmente têm probabilidades mais baixas do que outras em direção ao centro do intervalo. Obviamente, o intervalo de confiança convencional não diz nada diretamente sobre o parâmetro relevante para o experimento específico. Os intervalos de confiança de Neyman são 'globais', pois são projetados para ter propriedades de longo prazo, em vez de propriedades 'locais' relevantes para o experimento em questão. (Um bom desempenho a longo prazo pode ser interpretado no local, mas isso é um atalho intelectual e não uma realidade matemática.) Intervalos de probabilidade - nos casos em que podem ser construídos - refletem diretamente a probabilidade de relacionar o experimento em questão.
fonte
Suponha que alguém me disse que eu deveria confiar igualmente em todos os valores dentro de um IC95 como indicadores potenciais do valor da população. (Evito deliberadamente os termos "provável" e "provável".) O que há de especial em 95? Nada: para ser consistente, eu também teria que depositar confiança igual em todos os valores dentro de um CI96, um CI97, ... e um CI99.9999999. À medida que a cobertura do IC chegava ao limite, praticamente todos os números reais precisavam ser incluídos. O absurdo dessa conclusão me levaria a rejeitar a afirmação inicial.
fonte
Vamos começar com a definição de um intervalo de confiança. Se eu disser que um intervalo de confiança de 95% passa disso para isso, quero dizer que declarações dessa natureza serão verdadeiras cerca de 95% das vezes e falsas cerca de 5% das vezes. Eu não significa necessariamente que eu sou 95% confiante sobre este particular comunicado. Um intervalo de confiança de 90% será mais estreito e 80% ainda mais estreito. Portanto, ao me perguntar qual é o verdadeiro valor, tenho menos credibilidade nos valores à medida que eles se aproximam cada vez mais da margem de qualquer intervalo de confiança específico.
Observe que todas as opções acima são qualitativas, especialmente "credibilidade". (Evitei o termo "confiança" ou "probabilidade" nessa declaração porque eles carregam bagagem matemática que pode diferir da nossa bagagem intuitiva.) As abordagens bayesianas reformulariam sua pergunta para algo que tenha uma resposta quantitativa, mas não quero abrir essa lata de vermes aqui.
O texto clássico de Box, Hunter & Hunter ("Statistics for Experimenters", Wiley, 1978) também pode ajudar. Veja "Conjuntos de Intervalos de Confiança" na p. 113, ss.
fonte