Quais são as definições de pré-conjugados semi-conjugados e condicionais condicionais?

12

Quais são as definições de prioros semi-conjugados e de antecedentes conjugados condicionais ? Encontrei-os na Análise Bayesiana de Dados de Gelman , mas não consegui encontrar suas definições.

Tim
fonte

Respostas:

16

Usando a definição na Análise Bayesiana de Dados (3ª ed) , se for uma classe de distribuições de amostragem e é uma classe de distribuições anteriores para , então o classe é conjugado para se p ( y | θ ) P θ P FFp(y|θ)PθPF

p(θ|y)P for all p(|θ)F and p()P.

Se for uma classe de distribuições de amostragem e for uma classe de distribuições anteriores para condicional em , então a classe é conjugado condicional para se p ( y | θ , ϕ ) P θ ϕ P FFp(y|θ,ϕ)PθϕPF

p(θ|y,ϕ)P for all p(|θ,ϕ)F and p(|ϕ)P.

Priores condicionalmente conjugados são convenientes na construção de um amostrador de Gibbs, uma vez que o condicional completo será uma família conhecida.

Pesquisei uma versão eletrônica do Bayesian Data Analysis (3ª ed.) E não consegui encontrar uma referência ao semi-conjugado anterior. Acho que é sinônimo de conjugado condicional, mas se você fornecer uma referência ao seu uso no livro, eu devo fornecer uma definição.

jaradniemi
fonte
+1. Qual é o URL da 3ª edição do Bayesian Data Analysis?
Patrick Coulombe 22/03
1
Obrigado! O semi-conjugado aparece aqui (2ª ed) books.google.com/… . A propósito, como você conseguiu o e-book para a 3ª edição?
Tim
1
Não sei por que diz semiconjugado prior lá, já que o prior é totalmente conjugado. Esta declaração foi removida na 3ª edição. O e-book pode ser adquirido aqui: crcpress.com/product/isbn/9781439840955 .
22414 jaradniemi
@jaradniemi: No link que forneci, além da p84, é apontado que o semiconjugado anterior não é um conjugado anterior.
Tim
1
Em a que cada um dos refere e cada um se refere à mesma coisa?
p(θ|y,ϕ)P for all p(|θ,ϕ)F and p(|ϕ)P.
Muno
6

Eu gostaria de usar o multivariado normal como exemplo.

Lembre-se de que a probabilidade é dada por

P(y1,y2,...,yn|μ,Σ)=(2π)ND2det(Σ)N2exp(12i=1N(xiμ)TΣ1(xiμ))

A fim de encontrar um antes dessa probabilidade, podemos escolher

P(μ,Σ)=Normal(μ;μ0,Λ0)InverseWishart(Σ;ν0,S0)

Garanto que NÃO se preocupe com por enquanto; eles são simplesmente parâmetros da distribuição anterior.μ0,Λ0,ν0,S0

O importante é, no entanto, que isso não seja conjugado com a probabilidade. Para entender por que, eu gostaria de citar uma referência que encontrei online.

observe que e aparecem juntos de maneira não fatorada na probabilidade; portanto, eles também serão acoplados na parte posteriorΣμΣ

A referência é "Machine Learning: A Probabilistic Perspective", de Kevin P. Murphy. Aqui está o link . Você pode encontrar a cotação na Seção 4.6 (Inferindo os parâmetros de uma MVN) na parte superior da página 135.

Para continuar a cotação,

O acima anterior é por vezes chamado de semi-conjugado ou condicionalmente conjugado , uma vez que ambos os condicionais, e , são individualmente conjugado. Para criar um conjugado completo a prior , precisamos usar um prior em que e sejam dependentes um do outro. Usaremos uma distribuição conjunta do formuláriop ( Σ | μ ) μ Σp(μ|Σ)p(Σ|μ)μΣ

p(μ,Σ)=p(Σ)p(μ|Σ)

A idéia aqui é que a primeira distribuição prévia

P(μ,Σ)=Normal(μ;μ0,Λ0)InverseWishart(Σ;ν0,S0)

assume que e são separáveis ​​(ou independentes em um sentido). No entanto, observamos que na função de probabilidade, e não podem ser fatorados separadamente, o que implica que eles não serão separáveis ​​no posterior (Lembre-se, ). Isso mostra que o "não separável" posterior e o "separável" anterior no início não são conjugados. Por outro lado, reescrevendoμΣμΣ(Posterior)(Prior)(Likelihood)

p(μ,Σ)=p(Σ)p(μ|Σ)

de modo que e dependam um do outro (através de ), você obterá um conjugado prioritário, denominado como semi-conjugado prioritário . Espero que isso responda à sua pergunta.μΣp(μ|Σ)

ps : Outra referência realmente útil que usei é "Um Primeiro Curso de Métodos Estatísticos Bayesianos", de Peter D. Hoff. Aqui está um link para o livro. Você pode encontrar conteúdo relevante na Seção 7, a partir da página 105, e ele tem uma explicação (e intuição) muito boa sobre a distribuição normal de variável única na Seção 5, a partir da página 67, que será reforçada novamente na Seção 7, quando ele lida com MVN.

NeverBe
fonte
1

Se é uma classe de distribuições de amostragem e é uma classe de distribuições anteriores para , então a classe é semiconjugada para se para todos os e , onde e não pertence à classe .P ( Y | θ , φ ) P θ P F p ( θ | y , φ ) P p ( | θ , φ ) F p ( θ , φ ) = p ( θ ) × p ( φ ) p ( θ ) P p ( ϕ ) PFp(y|θ,ϕ)PθPFp(θ|y,ϕ)Pp(|θ,ϕ)Fp(θ,ϕ)=p(θ)×p(ϕ)p(θ)Pp(ϕ)P

nudtlxt
fonte