Como se formaliza uma distribuição de probabilidade anterior? Existem regras práticas ou dicas que alguém deve usar?

Embora eu goste de pensar que tenho uma boa compreensão do conceito de informações prévias na análise estatística e na tomada de decisões bayesianas, muitas vezes tenho problemas para entender minha aplicação. Tenho em mente algumas situações que exemplificam minhas lutas e sinto que elas não são abordadas adequadamente nos livros de estatística bayesiana que li até agora:

Digamos que eu fiz uma pesquisa há alguns anos atrás, que diz que 68% das pessoas estariam interessadas em comprar um produto ACME. Eu decido executar a pesquisa novamente. Embora eu esteja usando o mesmo tamanho de amostra da última vez (por exemplo, n = 400), as opiniões das pessoas provavelmente mudaram desde então. No entanto, se eu usasse anteriormente uma distribuição beta na qual 272 dos 400 respondentes respondessem "sim", eu daria o mesmo peso à pesquisa que fiz alguns anos atrás e à que eu estaria executando agora. Existe uma regra prática para estabelecer a maior incerteza que eu gostaria de colocar no prior em virtude desses dados terem alguns anos de idade? Entendo que posso reduzir o anterior de 272/400 para, digamos, 136/200, mas isso parece extremamente arbitrário, e me pergunto se há alguma forma de justificativa, talvez na literatura,

Para outro exemplo, digamos que estamos prestes a executar um ensaio clínico. Antes de iniciar o estudo, realizamos algumas pesquisas secundárias que poderíamos usar como informação prévia, incluindo opiniões de especialistas, resultados de ensaios clínicos anteriores (de relevância variável), outros fatos científicos básicos, etc. Como se pode combinar esse espectro de informações (alguns dos quais não são quantitativos por natureza) para uma distribuição de probabilidade anterior? É apenas um caso de tomar uma decisão sobre qual família escolher e torná-la difusa o suficiente para garantir que ela fique sobrecarregada pelos dados ou há muito trabalho para estabelecer uma distribuição prévia bastante informativa?

bayesian prior rule-of-thumb elicitation Phil
fonte

Veja stats.stackexchange.com/questions/1/…

Tim

Respostas:

Sua idéia de tratar suas informações anteriores de 272 sucessos em 400 tentativas tem justificativa bayesiana bastante sólida.

O problema com o qual você está lidando, como reconheceu, é o de estimar uma probabilidade de sucesso de um experimento de Bernoulli. A distribuição Beta é o "conjugado anterior" correspondente. Esses antecedentes conjugados desfrutam da "interpretação fictícia da amostra": $\theta$

A beta anterior é Isso pode ser interpretado como a informação contida em uma amostra de tamanho (de maneira geral, pois não precisa ser inteiro, é claro ) com sucessos: Portanto, se você e , isso corresponderá aos parâmetros anteriores e

π (θ) = \frac{Γ (α_{0} + β_{0})}{Γ (α_{0}) Γ (β_{0})} θ^{α_{0} - 1} (1 - θ)^{β_{0} - 1}

$\pi(\theta)=\frac{\Gamma(\alpha_0+\beta_0)}{\Gamma(\alpha_0)\Gamma(\beta_0)}\theta^{\alpha_0-1}(1-\theta)^{\beta_0-1}$

\underline{n} = α_{0} + β_{0} - 2

$\underline{n}=\alpha_0+\beta_0-2$

\underline{n}

$\underline{n}$

α_{0} - 1

$\alpha_0-1$

π (θ) = \frac{Γ (α_{0} + β_{0})}{Γ (α_{0}) Γ (β_{0})} θ^{α_{0} - 1} (1 - θ)^{\underline{n} - (α_{0} - 1)}

$\pi(\theta)=\frac{\Gamma(\alpha_0+\beta_0)}{\Gamma(\alpha_0)\Gamma(\beta_0)}\theta^{\alpha_0-1}(1-\theta)^{\underline{n}-(\alpha_0-1)}$

α_{0} + β_{0} - 2 = 400

$\alpha_0+\beta_0-2=400$

α_{0} - 1 = 272

$\alpha_0-1=272$

α_{0} = 273

$\alpha_0=273$

β_{0} = 129

$\beta_0=129$ . "Cortar pela metade" a amostra levaria a parâmetros anteriores e . Agora, lembre-se de que a média anterior e a variância anterior da distribuição beta são dadas por metade da amostra mantém a média anterior (quase) onde está:

α_{0} = 137

$\alpha_0=137$

β_{0} = 65

$\beta_0=65$

μ = \frac{α}{α + β} and σ^{2} = \frac{α β}{(α + β)^{2} (α + β + 1)}

$\mu=\frac{\alpha}{\alpha+\beta}\qquad\text{and}\qquad\sigma^2=\frac{\alpha\beta}{(\alpha+\beta)^2(\alpha+\beta+1)}$

alpha01 <- 273
beta01 <- 129
(mean01 <- alpha01/(alpha01+beta01))

alpha02 <- 137
beta02 <- 65
(mean02 <- alpha02/(alpha02+beta02))

mas aumenta a variação anterior de

(priorvariance01 <- (alpha01*beta01)/((alpha01+beta01)^2*(alpha01+beta01+1)))
[1] 0.0005407484

para

(priorvariance02 <- (alpha02*beta02)/((alpha02+beta02)^2*(alpha02+beta02+1)))
[1] 0.001075066

como desejado.

Christoph Hanck
fonte