Muitos intervalos de confiança freqüentes (ICs) são baseados na função de probabilidade. Se a distribuição anterior é realmente não informativa, o posterior a Bayesiano tem essencialmente a mesma informação que a função de probabilidade. Consequentemente, na prática, um intervalo de probabilidade bayesiano (ou intervalo credível) pode ser muito semelhante numericamente a um intervalo de confiança freqüentista. [É claro que, mesmo que numericamente similares, haja diferenças filosóficas na interpretação entre estimativas de intervalos freqüentistas e bayesianas.]
Aqui está um exemplo simples, estimando a probabilidade de sucesso binomial θ.
Suponha que tenhamos n=100 observações (tentativas) com X=73 sucessos.
Frequencista: Os tradicionais Wald intervalo de usos do ponto estimativa
θ = X / n = 73 / 100 = 0,73. E o IC de 95% é da forma
q ± 1,96 √θ^=X/n=73/100=0.73.
θ^±1.96θ^(1−θ^)n−−−−−−−−√,
que calcula até
(0.643,0.817).
n = 100; x = 73; th.w = x/n; pm = c(-1,1)
ci.w = th.w + pm*1.96*sqrt(th.w*(1-th.w)/n); ci.w
[1] 0.6429839 0.8170161
Essa forma de IC pressupõe que as distribuições binomiais relevantes possam ser aproximadas pelas normais e que a margem de erro é bem aproximado por
√θ(1−θ)/n−−−−−−−−−√Especialmente paranpequeno,essas suposições não precisam ser verdadeiras. [Os casos em queX=0ouX=nsão especialmente problemáticos.]θ^(1−θ^)/n−−−−−−−−−√.n,X=0X=n
O IC Agresti-Coull demonstrou ter uma probabilidade de cobertura mais precisa. Esse intervalo 'adiciona dois Sucesso e duas Falhas' como um truque para obter uma probabilidade de cobertura mais próxima de 95%. Começa com a estimativa pontual
onde ˜ n + 4. Então, um IC de 95% tem a forma
˜ θ ± 1,96 √θ~=(X+2)/n~,n~+4.
que calcula para(0,612,0,792). Paran>100e0,3<~θ<0,7,a diferença entre estes dois estilos de intervalos de confiança é quase insignificante.
θ~±1.96θ~(1−θ~)n~−−−−−−−−√,
(0.612,0.792).n>1000.3<θ~<0.7,
ci.a = th.a + pm*1.96*sqrt(th.a*(1-th.a)/n); ci.a
[1] 0.6122700 0.7915761
Bayesiana:
Uma populares noninformative antes nesta situação é A função de probabilidade é proporcional a
θ x ( 1 - θ ) n - x . Multiplicando os núcleos da anterior e da probabilidade, temos o núcleo da distribuição posterior
B e t a ( x + 1 ,Beta(1,1)≡Unif(0,1).θx(1−θ)n−x.Beta(x+1,n−x+1).
Então, uma estimativa do intervalo bayesiano de 95% usa os quantis 0,025 e 0,975 da distribuição posterior para obter
Quando a distribuição anterior é 'plana' ou 'não informativa', a diferença numérica entre o intervalo de probabilidade bayesiano e o intervalo de confiança de Agresti-Coull é pequena.(0.635,0.807).
qbeta(c(.025, .975), 74, 28)
[1] 0.6353758 0.8072313
Notas: (a) Nesta situação, alguns bayesianos preferem o anterior não informativo (b) Para níveis de confiança diferentes de 95%, o Agresti-Coull CI utiliza uma estimativa pontual ligeiramente diferente. (c) Para dados que não sejam binomiais, pode não haver um 'plano' anterior disponível, mas pode-se escolher um anterior com uma enorme variação (pequena precisão) que transporta muito pouca informação. (d) Para mais discussões sobre os ICs da Agresti-Coull, gráficos de probabilidades de cobertura e algumas referências, talvez também veja estas Perguntas e Respostas .Beta(.5,.5).
A função de verossimilhança e o intervalo de confiança associado não são os mesmos (conceito) que uma probabilidade posterior bayesiana construída com um prior que especifica uma distribuição uniforme.
Nas partes 1 e 2 desta resposta, argumenta-se por que a probabilidade não deve ser vista como uma probabilidade posterior bayesiana com base em um plano anterior.
Na parte 3, é apresentado um exemplo em que o intervalo de confiança e o intervalo credível variam amplamente. Também é apontado como essa discrepância surge.
1 Comportamento diferente quando a variável é transformada
A função de probabilidade não se transforma dessa maneira . Este é o contraste entre a função de probabilidade e a probabilidade posterior. A função de probabilidade (máxima da) permanece a mesma quando você transforma a variável.
Relacionado:
O plano anterior é ambíguo . Depende da forma da estatística específica.
Por exemplo, se é distribuído uniformemente (por exemplo, , então não é uma variável distribuída uniforme.X U(0,1)) X2
Não há um único plano anterior ao qual você possa relacionar a função Probabilidade. É diferente quando você define o plano anterior para ou alguma variável transformada como . Pela probabilidade dessa dependência não existir.X X2
Os limites das probabilidades (intervalos de credibilidade) serão diferentes quando você transformar a variável (para funções de probabilidade, esse não é o caso) . Por exemplo, para algum parâmetro e uma transformação monotônica (por exemplo logaritmo), obtém os equivalentes intervalos de probabilidadea f(a) aminf(amin)<<af(a)<<amaxf(amax)
2 Conceito diferente: os intervalos de confiança são independentes dos anteriores
Suponha que você faça uma amostra de uma variável de uma população com o parâmetro (desconhecido) que (a população com o parâmetro ) é amostrada de uma superpopulação (com valores possivelmente variáveis para ).X θ θ θ
Pode-se fazer uma afirmação inversa tentar inferir o que o original pode ter sido baseada na observação de alguns valores para a variável .θ xi X
O intervalo de confiança não usa informações anteriores, como o intervalo credível (confiança não é uma probabilidade).
Independentemente da distribuição anterior (uniforme ou não), o intervalo x% de confiança conterá o parâmetro true em dos casosx (intervalos de confiança referem-se à taxa de sucesso, erro tipo I, do método, não de um caso particular) .
No caso do intervalo credível, esse conceito ( de tempo em que o intervalo contém o parâmetro true) nem é aplicável, mas podemos interpretá-lo em um sentido freqüentista e, em seguida, observamos que o intervalo credible conterá apenas o parâmetro true do tempo em que o anterior (uniforme) está descrevendo corretamente a superpopulação de parâmetros que podemos encontrar. O intervalo pode efetivamente ter um desempenho maior ou menor que x% (não que isso importe, pois a abordagem bayesiana responde a perguntas diferentes, mas é apenas para observar a diferença).x
3 Diferença entre confiança e intervalos credíveis
No exemplo abaixo, examinamos a função de probabilidade para a distribuição exponencial em função do parâmetro de taxa , a média da amostra e o tamanho da amostra :λ x¯ n
essas funções expressam a probabilidade de observar (para um dado e ) uma média da amostra entre e .n λ x¯ x¯+dx
nota: o parâmetro de taxa vai de a (diferente da OP 'solicitação' de a ). O prior neste caso será um prior impróprio . Os princípios, no entanto, não mudam. Estou usando essa perspectiva para facilitar a ilustração. Distribuições com parâmetros entre e geralmente são distribuições discretas (difíceis de desenhar linhas contínuas) ou uma distribuição beta (difícil de calcular)λ 0 ∞ 0 1 0 1
A imagem abaixo ilustra essa função de probabilidade (o mapa colorido em azul), para o tamanho da amostra , e também desenha os limites dos intervalos de 95% (confiança e credibilidade).n=4
Os limites são criados obtendo a função de distribuição cumulativa (unidimensional). Mas, essa integração / acumulação pode ser feita em duas direções .
A diferença entre os intervalos ocorre porque as áreas de 5% são feitas de maneiras diferentes.
O intervalo de confiança de 95% contém valores para os quais o valor observado ocorreria pelo menos em 95% dos casos. Nesse caminho. qualquer que seja o valor , somente julgaremos errado em 95% dos casos.λ x¯ λ
Para qualquer você tem norte e sul dos limites (alterando ) 2,5% do peso da função de probabilidade.λ x¯
O intervalo de 95% credível contém valores que provavelmente causam o valor observado (dado um plano anterior).λ x¯
Mesmo quando o resultado observado tiver menos de 5% de probabilidade para um dado , o pode estar dentro do intervalo credível. No exemplo em particular, valores mais altos de são 'preferidos' para o intervalo credível.x¯ λ λ λ
Para qualquer você tem oeste e leste dos limites (alterando ) 2,5% do peso da função de probabilidade.x¯ λ
Um caso em que o intervalo de confiança e o intervalo credível (com base no anterior impróprio) coincidem é para estimar a média de uma variável distribuída gaussiana (a distribuição é ilustrada aqui: https://stats.stackexchange.com/a/351333/164061 ).
Um caso óbvio em que o intervalo de confiança e o intervalo credível não coincidem é ilustrado aqui ( https://stats.stackexchange.com/a/369909/164061 ). O intervalo de confiança para este caso pode ter um ou até ambos os limites (superior / inferior) no infinito.
fonte
Isso geralmente não é verdade, mas pode parecer assim por causa dos casos especiais mais frequentemente considerados.
ConsidereO intervalo é um intervalo de confiança de para embora não seja aquele que alguém com bom senso usaria. Não coincide com um intervalo credível de da parte posterior de um plano anterior.X,Y∼i.i.d∼Uniform[θ−1/2,θ+1/2]. (min{X,Y},max{X,Y}) 50% θ, 50%
A técnica de Fisher de condicionamento em uma estatística auxiliar produz, nesse caso, um intervalo de confiança que coincide com esse intervalo credível.
fonte
Pela minha leitura, achei que essa afirmação é verdadeira assintoticamente, ou seja, para um grande tamanho de amostra e se alguém usa um anterior não informativo.
Um exemplo numérico simples parece confirmar isso - os intervalos de probabilidade máxima de 90% do perfil e os intervalos credíveis de 90% de um GLM binomial ML e GLM binomial bayesiano são de fato praticamente idênticos
n=1000
, embora a discrepância se torne maior para pequenosn
:Como você pode ver, no exemplo acima, para
n=1000
, os intervalos de confiança de perfil de 90% de um GLM binomial são praticamente idênticos aos intervalos credíveis de 90% de um GLM binomial bayesiano (a diferença também está dentro dos limites do uso de sementes diferentes e diferentes s de iterações nos ajustes bayesianos, e uma equivalência exata também não pode ser obtida, pois especificar um pré-informativo 100% não informativo também não é possível comrstanarm
oubrms
).fonte