Sei grosseiramente e informalmente o que é um intervalo de confiança. No entanto, parece que não consigo entender um detalhe bastante importante: de acordo com a Wikipedia:
Um intervalo de confiança não prevê que o valor real do parâmetro tenha uma probabilidade específica de estar no intervalo de confiança, dados os dados realmente obtidos.
Eu também vi pontos semelhantes feitos em vários lugares neste site. Uma definição mais correta, também da Wikipedia, é:
se intervalos de confiança são construídos em várias análises de dados separadas de experimentos repetidos (e possivelmente diferentes), a proporção desses intervalos que contêm o valor verdadeiro do parâmetro corresponderá aproximadamente ao nível de confiança
Mais uma vez, eu já vi pontos semelhantes em vários lugares deste site. Eu não entendo. Se, em experimentos repetidos, a fração dos intervalos de confiança calculados que contêm o parâmetro verdadeiro for , como pode a probabilidade de no intervalo de confiança calculado para o experimento real ser diferente de ? Estou procurando o seguinte em uma resposta:
Esclarecimento da distinção entre as definições incorretas e corretas acima.
Uma definição formal e precisa de um intervalo de confiança que mostra claramente por que a primeira definição está errada.
Um exemplo concreto de um caso em que a primeira definição está espetacularmente errada, mesmo que o modelo subjacente esteja correto.
fonte
mu
e B) a variabilidade da replicação significa ao redormu
. A maioria das pessoas esquece A: o IC original não é necessariamente construído ao redormu
!Respostas:
Achei esse experimento mental útil ao pensar em intervalos de confiança. Ele também responde à sua pergunta 3.
Seja e . Considere duas observações de tomando os valores e correspondentes às observações e de e deixe e . Então é um intervalo de confiança de 50% para (já que o intervalo inclui se ou , cada um com probabilidade ).Y = X + a - 1X∼U(0,1) Y=X+a−12 Y y1 y2 x1 x2 X yl=min(y1,y2) yu=max(y1,y2) [yl,yu] a a x1<12<x2 x1>12>x2 14
No entanto, se , sabemos que a probabilidade de o intervalo conter é , não . A sutileza é que um intervalo de confiança para um parâmetro significa que os pontos finais do intervalo (que são variáveis aleatórias) se situam em ambos os lados do parâmetro com probabilidade antes de calcular o intervalo , não que a probabilidade do parâmetro ficar dentro do intervalo é depois que você calculou o intervalo .yu−yl>12 a 1 12 z% z% z%
fonte
Existem muitos problemas relacionados a intervalos de confiança, mas vamos nos concentrar nas citações. O problema está em possíveis interpretações erradas, em vez de ser uma questão de correção. Quando as pessoas dizem que "um parâmetro tem uma probabilidade específica de" algo, elas estão pensando no parâmetro como sendo uma variável aleatória. Este não é o ponto de vista de um procedimento de intervalo de confiança (clássico), para o qual a variável aleatória é o próprio intervalo e o parâmetro é determinado, não aleatório, mas desconhecido. É por isso que essas declarações são frequentemente atacadas.
Matematicamente, se deixarmos ser qualquer processo que mapeia dados para subconjuntos do espaço de parâmetros e se (não importa qual é o valor do parâmetro pode ser) a afirmação define um evento , por definição, tem uma probabilidade para qualquer valor possível de . Quando é um procedimento de intervalo de confiança com confiança , essa probabilidade deve ter um número mínimo (acima de todos os valores de parâmetro) dex = ( x i ) θ θ ∈ t ( x ) A ( x ) Pr θ ( A ( x ) ) θ t 1 - α 1 - αt x=(xi) θ θ∈t(x) A(x) Prθ(A(x)) θ t 1−α 1−α . (Sujeito a esse critério, geralmente selecionamos procedimentos que otimizam algumas propriedades adicionais, como produzir intervalos curtos de confiança ou simétricos, mas isso é um assunto separado.) A Lei Fraca de Grandes Números justifica a segunda cotação. Isso, no entanto, não é uma definição de intervalos de confiança: é apenas uma propriedade que eles têm.
Penso que esta análise respondeu à pergunta 1, mostra que a premissa da pergunta 2 está incorreta e torna a questão 3 discutível.
fonte
Eu não chamaria a definição de ICs de errada, mas eles são fáceis de interpretar mal, devido à existência de mais de uma definição de probabilidade. Os ICs são baseados na seguinte definição de Probabilidade (Frequentista ou Ontológica)
(1) probabilidade de uma proposição = proporção de longo prazo de vezes que a proposição é observada verdadeira, condicional ao processo de geração de dados
Portanto, para ser conceitualmente válido no uso de um IC, você deve aceitar esta definição de probabilidade. Caso contrário, seu intervalo não é um IC, do ponto de vista teórico.
É por isso que a definição usou a proporção de palavras e NÃO a probabilidade de palavras , para deixar claro que a definição de probabilidade "frequência de longo prazo" está sendo usada.
A principal definição alternativa de probabilidade (epistemológica ou probabilidade como uma extensão da lógica dedutiva ou bayesiana) é
(2) probabilidade de uma proposição = grau racional de crença de que a proposição é verdadeira, condicionada a um estado de conhecimento
As pessoas geralmente confundem intuitivamente essas duas definições e usam a interpretação que aconteça para atrair sua intuição. Isso pode levar você a todos os tipos de situações confusas (especialmente quando você muda de um paradigma para outro).
O fato de as duas abordagens frequentemente levarem ao mesmo resultado significa que, em alguns casos, temos:
grau racional de crença de que a proposição é verdadeira, condicional a um estado de conhecimento = proporção de longo prazo de vezes que a proposição é observada verdadeira, condicional ao processo de geração de dados
O ponto é que ele não se sustenta universalmente ; portanto, não podemos esperar que as duas definições diferentes sempre levem aos mesmos resultados. Portanto, a menos que você efetivamente elabore a solução bayesiana e encontre o mesmo intervalo, não será possível atribuir ao intervalo dado pelo IC a interpretação como uma probabilidade de conter o valor verdadeiro. E se o fizer, o intervalo não é um intervalo de confiança, mas um intervalo credível.
fonte
RA Fisher tinha um critério para a utilidade dos intervalos de confiança: Um IC não deve admitir "subconjuntos identificáveis" que impliquem um nível de confiança diferente. Na maioria dos exemplos (se não todos), temos casos em que existem subconjuntos identificáveis com probabilidades de cobertura diferentes.
Nesses casos, você pode usar intervalos de créditos bayesianos para especificar um senso subjetivo de onde está o parâmetro ou pode formular um intervalo de probabilidade para refletir a incerteza relativa no parâmetro, dados os dados.
Por exemplo, um caso que parece relativamente livre de contradições é o intervalo de confiança normal de dois lados para a média da população. Assumindo amostragem de uma população normal com determinado padrão, o IC95% não admite subconjuntos identificáveis que forneçam mais informações sobre o parâmetro. Isso pode ser visto pelo fato de que a média da amostra é uma estatística suficiente na função de verossimilhança - ou seja, a função de verossimilhança é independente dos valores individuais da amostra, uma vez que sabemos a média da amostra.
A razão pela qual temos alguma confiança subjetiva no IC simétrico de 95% para a média normal decorre menos da probabilidade de cobertura declarada e mais do fato de que o IC de 95% simétrico para a média normal é o intervalo de "maior probabilidade", ou seja, todos valores de parâmetro dentro do intervalo têm uma probabilidade mais alta do que qualquer valor fora do intervalo. No entanto, como a probabilidade não é uma probabilidade (no sentido da precisão a longo prazo), é mais um critério subjetivo (como é o uso bayesiano do anterior e da probabilidade). Em resumo, existem infinitos intervalos para a média normal que têm 95% de probabilidade de cobertura, mas apenas o IC simétrico tem a plausibilidade intuitiva que esperamos de uma estimativa de intervalo.
Portanto, o critério de RA Fisher implica que a probabilidade de cobertura deve equiparar-se à confiança subjetiva apenas se não admitir nenhum desses subconjuntos identificáveis. Se houver subconjuntos, a probabilidade de cobertura estará condicionada aos valores reais do (s) parâmetro (s) que descrevem o subconjunto. Para obter um intervalo com o nível intuitivo de confiança, você precisa condicionar o intervalo estimado nas estatísticas auxiliares apropriadas que ajudam a identificar o subconjunto. OU, você pode recorrer a modelos de dispersão / mistura, que naturalmente levam a interpretar os parâmetros como variáveis aleatórias (também conhecidas como estatísticas bayesianas) ou pode calcular o perfil / probabilidade condicional / marginal na estrutura de probabilidade. De qualquer forma, você abandonou qualquer esperança de apresentar uma probabilidade objetivamente verificável de estar correta,
Espero que isto ajude.
fonte
De uma perspectiva teórica, as perguntas 2 e 3 são baseadas na suposição incorreta de que as definições estão erradas. Portanto, estou de acordo com a resposta da @ whuber a esse respeito, e a resposta da @ whuber para a pergunta 1 não exige nenhuma contribuição adicional minha.
No entanto, de uma perspectiva mais prática, um intervalo de confiança pode receber sua definição intuitiva (probabilidade de conter o valor verdadeiro) quando é numericamente idêntico a um intervalo credível bayesiano com base nas mesmas informações (isto é, um prévio não informativo).
Mas isso é um pouco desanimador para o duro anti-bayesiano, porque, a fim de verificar as condições para dar ao seu IC a interpretação que ele / ela deseja dar, eles devem elaborar a solução bayesiana, para a qual a interpretação intuitiva se aplica automaticamente!
O exemplo mais fácil é um intervalo de confiança para a média normal com uma variação conhecida e um intervalo credível posterior .1−α x¯¯¯±σZα/2 1−α x¯¯¯±σZα/2
Não tenho exatamente certeza das condições, mas sei que o seguinte é importante para a interpretação intuitiva dos ICs:
1) existe uma estatística de pivô, cuja distribuição é independente dos parâmetros (existem pivôs exatos fora das distribuições normal e do qui-quadrado?)
2) não há parâmetros de incômodo (exceto no caso de uma estatística central, que é uma das poucas maneiras exatas de lidar com parâmetros de incômodo ao criar ICs)
3) existe uma estatística suficiente para o parâmetro de interesse e o intervalo de confiança usa a estatística suficiente
4) a distribuição amostral da estatística suficiente e a distribuição posterior apresentam algum tipo de simetria entre a estatística suficiente e o parâmetro. No caso normal da distribuição amostral, a simetria está em enquanto .(μ|¯x,σ)∼N(¯x,σ(x¯¯¯|μ,σ)∼N(μ,σn√) (μ|x¯¯¯,σ)∼N(x¯¯¯,σn√)
Geralmente, essas condições são difíceis de encontrar e geralmente é mais rápido calcular o intervalo bayesiano e compará-lo. Um exercício interessante também pode ser tentar responder à pergunta "para que data anterior meu IC também é um intervalo de credibilidade?" Você pode descobrir algumas suposições ocultas sobre seu procedimento de IC examinando isso anteriormente.
fonte
Isso é algo que pode ser difícil de entender:
Um intervalo de confiança refere-se ao procedimento de amostragem. Se você coletar muitas amostras e calcular um intervalo de confiança de 95% para cada amostra, descobrirá que 95% desses intervalos contêm a média da população.
Isso é útil para, por exemplo, departamentos de qualidade industrial. Esses caras tiram muitas amostras e agora têm a confiança de que a maioria de suas estimativas estará bem próxima da realidade. Eles sabem que 95% de suas estimativas são muito boas, mas não podem dizer isso sobre cada estimativa específica.
Compare isso com os dados: se você jogasse 600 (justos) dados, quantos 6 você jogaria? Seu melhor palpite é * 600 = 100.16
No entanto, se você jogou UM dado, é inútil dizer: "Existe uma probabilidade de 1/6 ou 16,6% de que eu já joguei um 6". Por quê? Porque o dado mostra um 6 ou alguma outra figura. Você jogou 6, ou não. Portanto, a probabilidade é 1 ou 0. A probabilidade não pode ser .16
Quando perguntado antes do lance qual seria a probabilidade de jogar um 6 com um dado, um bayesiano responderia " " (com base em informações anteriores: todo mundo sabe que um dado tem 6 lados e uma chance igual de cair em um deles), mas um Frequentista diria "Não faço ideia" porque o freqüentismo é baseado exclusivamente nos dados, não em antecedentes ou em informações externas.16
Da mesma forma, se você tiver apenas 1 amostra (portanto, 1 intervalo de confiança), não poderá dizer qual é a probabilidade de a média da população estar nesse intervalo. A média (ou qualquer parâmetro) está nela ou não. A probabilidade é 1 ou 0.
Além disso, não é correto que os valores dentro do intervalo de confiança sejam mais prováveis do que aqueles fora dele. Eu fiz uma pequena ilustração; tudo é medido em ° C. Lembre-se de que a água congela a 0 ° C e ferve a 100 ° C.
O caso: em um lago frio, gostaríamos de estimar a temperatura da água que flui abaixo do gelo. Medimos a temperatura em 100 locais. Aqui estão os meus dados:
As temperaturas nesse intervalo de confiança definitivamente NÃO são mais prováveis do que as que estão fora dele. A temperatura média da água corrente neste lago NÃO PODE ser mais fria que 0 ° C, caso contrário não seria água, mas gelo. Uma parte desse intervalo de confiança (ou seja, a seção de -0,8 a 0) realmente tem uma probabilidade de 0% de conter o parâmetro true.
Concluindo: os intervalos de confiança são um conceito freqüentista e, portanto, são baseados na ideia de amostras repetidas. Se muitos pesquisadores coletassem amostras desse lago e todos os pesquisadores calculassem intervalos de confiança, 95% desses intervalos conterão o parâmetro true. Mas, para um único intervalo de confiança, é impossível dizer qual a probabilidade de conter o parâmetro true.
fonte
Ok, percebo que quando você calcula um intervalo de confiança de 95% para um parâmetro usando métodos freqüentadores clássicos, isso não significa que há uma probabilidade de 95% de que o parâmetro esteja dentro desse intervalo. E, no entanto ... quando você aborda o problema de uma perspectiva bayesiana e calcula um intervalo credível de 95% para o parâmetro, obtém (assumindo um anterior não informativo) exatamente o mesmo intervalo que utiliza a abordagem clássica. Portanto, se eu usar estatísticas clássicas para calcular o intervalo de confiança de 95% para (digamos) a média de um conjunto de dados, é verdade que há uma probabilidade de 95% de que o parâmetro esteja nesse intervalo.
fonte
Você está perguntando sobre o intervalo de confiança Frequentist . A definição (observe que nenhuma das suas 2 citações é uma definição! As declarações Just, que estão corretas) são:
Então você tem um modelo (construído usando os dados observados) e seus parâmetros estimados. Então, se você gerasse alguns conjuntos de dados hipotéticos de acordo com este modelo e parâmetros, os parâmetros estimados cairiam dentro do intervalo de confiança.
Portanto, de fato, essa abordagem freqüentista toma o modelo e os parâmetros estimados como fixos, como dados e trata seus dados como incertos - como uma amostra aleatória de muitos outros dados possíveis.
Isso é realmente difícil de interpretar e esta é muitas vezes usado como um argumento para a estatística bayesiana ( que eu acho que pode ser, por vezes, pouco discutível . As estatísticas Bayesian, por outro lado leva seus dados como parâmetros fixos e trata como incerto. Os bayesiana intervalos credíveis são então é realmente intuitivo, como seria de esperar: intervalos bayesianos credíveis são intervalos em que 95% do valor real do parâmetro está.
Mas, na prática, muitas pessoas interpretam os intervalos de confiança freqüentadores da mesma maneira que os intervalos credíveis bayesianos e muitos estatísticos não consideram isso um grande problema - embora todos saibam, não é 100% correto. Também na prática, os intervalos de confiança / credibilidade freqüentista e bayesiano não diferem muito quando se usam anteriores não informativos bayesianos .
fonte
Suponha que estamos em uma situação simples. Você tem um parâmetro desconhecido e um estimador de que possui uma imprecisão em torno de 1 (informalmente). Você acha que (informalmente) deve estar em mais frequência.θ T θ θ [T−1;T+1]
Em um experimento real, você observa .T=12
É natural fazer a pergunta "Dado o que vejo ( ), qual é a probabilidade ?". Matematicamente: . Todo mundo naturalmente faz essa pergunta. A teoria do intervalo de confiança deve responder logicamente a essa pergunta. Mas isso não acontece.T=12 θ∈[11;13] P(θ∈[11;13]|T=12)
As estatísticas bayesianas respondem a essa pergunta. Na estatística bayesiana, você pode realmente calcular . Mas você precisa assumir uma anterior que é uma distribuição de antes de fazer a experiência e observando . Por exemplo :P(θ∈[11;13]|T=12) θ T
Mas, nas estatísticas freqüentistas, não há anterior e, portanto, algo como não existe. Em vez disso, os estatísticos dizem algo assim: "Seja o que for , a probabilidade de é de ". Matematicamente: "P(θ∈...|T∈...) θ θ∈[T−1;T+1] 0.95 ∀θ,P(θ∈[T−1;T+1]|θ)=0.95
Assim :
A afirmação bayesiana é mais natural. Na maioria das vezes, a afirmação freqüentista é mal interpretada espontaneamente como a afirmação bayesiana (por qualquer cérebro humano normal que não pratica estatística há anos). E honestamente, muitos livros de estatísticas não deixam esse ponto muito claro.
E praticamente?
Em muitas situações usuais, o fato é que as probabilidades obtidas por abordagens freqüentistas e bayesianas são muito próximas. Portanto, essa confusa declaração afirmativa para a bayesiana tem poucas consequências. Mas "filosoficamente" é muito diferente.
fonte