Exemplos de quando o intervalo de confiança e o intervalo credível coincidem

11

No artigo da wikipedia sobre o Credible Interval , ele diz:

No caso de um único parâmetro e dados que podem ser resumidos em uma única estatística suficiente, pode ser demonstrado que o intervalo credível e o intervalo de confiança coincidirão se o parâmetro desconhecido for um parâmetro de localização (ou seja, a função de probabilidade direta tem a forma Pr (x | μ) = f (x - μ)), com um prior que é uma distribuição plana uniforme; [5] e também se o parâmetro desconhecido for um parâmetro de escala (ou seja, a função de probabilidade direta tem a forma Pr (x | s) = f (x / s)), com o anterior de Jeffreys [5] - o último a seguir, porque o logaritmo de um parâmetro dessa escala o transforma em um parâmetro de localização com uma distribuição uniforme. Mas esses são casos distintamente especiais (embora importantes); em geral, essa equivalência não pode ser feita ".

As pessoas poderiam dar exemplos específicos disso? Quando o IC95% corresponde realmente a "95% de chance", "violando" a definição geral de IC?

Wayne
fonte

Respostas:

13

distribuição normal:

Faça uma distribuição normal com variação conhecida. Podemos considerar essa variação como 1 sem perder a generalidade (simplesmente dividindo cada observação pela raiz quadrada da variação). Isso tem distribuição de amostragem:

p(X1...XN|μ)=(2π)N2exp(12i=1N(Xiμ)2)=Aexp(N2(X¯μ)2)

Onde é uma constante que depende apenas dos dados. Isso mostra que a média da amostra é uma estatística suficiente para a média da população. Se usarmos um uniforme anterior, a distribuição posterior para será:Aμ

(μ|X1...XN)Normal(X¯,1N)(N(μX¯)|X1...XN)Normal(0,1)

Portanto, um intervalo credível terá o formato:1α

(X¯+1NLα,X¯+1NUα)

Onde e são escolhidos de modo que uma variável aleatória normal normal satisfaça:LαUαZ

Pr(Lα<Z<Uα)=1α

Agora podemos começar com essa "quantidade essencial" para construir um intervalo de confiança. A distribuição de amostragem de para fixa é uma distribuição normal padrão, portanto, podemos substituí-la pela probabilidade acima:N(μX¯)μ

Pr(Lα<N(μX¯)<Uα)=1α

Em seguida, reorganize a solução para , e o intervalo de confiança será o mesmo que o intervalo credível.μ

Parâmetros de escala:

Para parâmetros de escala, os PDFs têm o formato . Podemos pegar o , que corresponde a . A distribuição da amostragem conjunta é:p(Xi|s)=1sf(Xis)(Xi|s)Uniform(0,s)f(t)=1

p(X1...XN|s)=sN0<X1...XN<s

A partir da qual achamos que a estatística suficiente é igual a (o máximo das observações). Agora encontramos sua distribuição amostral:Xmax

Pr(Xmax<y|s)=Pr(X1<y,X2<y...XN<y|s)=(ys)N

Agora podemos tornar isso independente do parâmetro, tomando . Isso significa que nossa "quantidade central" é dada por com que é a distribuição . Portanto, podemos escolher usando os quantis beta, tais como:y=qsQ=s1XmaxPr(Q<q)=qNbeta(N,1)Lα,Uα

Pr(Lα<Q<Uα)=1α=UαNLαN

E substituímos a quantidade essencial:

Pr(Lα<s1Xmax<Uα)=1α=Pr(XmaxLα1>s>XmaxUα1)

E existe o nosso intervalo de confiança. Para a solução bayesiana com jeffreys anteriores, temos:

p(s|X1...XN)=sN1XmaxrN1dr=N(Xmax)NsN1
Pr(s>t|X1...XN)=N(Xmax)NtsN1ds=(Xmaxt)N

Agora, conectamos o intervalo de confiança e calculamos sua credibilidade

Pr(XmaxLα1>s>XmaxUα1|X1...XN)=(XmaxXmaxUα1)N(XmaxXmaxLα1)N

=UαNLαN=Pr(Lα<Q<Uα)

E pronto, temos credibilidade e cobertura .1α

probabilityislogic
fonte
Uma obra-prima, obrigado! Eu esperava que houvesse uma resposta como "ao calcular a média de uma amostra a partir de uma distribuição Normal, o IC 95% também é o intervalo de credibilidade de 95%" ou algo simples assim. (Basta fazer-se esta resposta deveria, eu não tenho nenhuma pista sobre exemplos específicos.)
Wayne
Acredito que um intervalo de predição / tolerância freqüente de 95% corresponde a um intervalo de predição bayesiano com regressão OLS e erros normais. Parece que, quando comparo a resposta do predict.lm com uma resposta simulada, de qualquer maneira. Isso é verdade?
307 Wayne Wayne
Para , se você usar um uniforme anterior para e jeffreys anteriores para , terá equivalência. α , β σY=α+βXα,βσ
probabilityislogic
Ótimo, obrigado! Eu tenho tentado explicar um IC para uma regressão que fiz em termos de um intervalo de confiança, e ele simplesmente não se conecta a um público leigo, que espera um intervalo credível. Torna a vida muito mais fácil para mim ... embora talvez seja ruim para o mundo estatístico geral, pois reforçará o mal-entendido dos leigos quanto aos ICs.
Wayne
@Wayne - a situação é um pouco mais geral do que apenas famílias em escala de localização. Normalmente, um IC será equivalente a um intervalo credível, se for baseado em uma "estatística suficiente" (como esses dois eram) onde isso existe. Se não houver estatística suficiente, o IC precisa condicionar o que é chamado de "estatística auxiliar" para ter uma interpretação de intervalo confiável.
probabilityislogic