Como faço para completar o quadrado com probabilidade normal e normal anterior?

8

Como concluo o quadrado a partir do ponto em que parei e isso está correto até agora?

Eu tenho um normal anterior para da forma p ( β | σ 2 ) N ( 0 , σ 2 V ) , para obter:βp(β|σ2)N(0,σ2V)

p(β|σ2)=(2πσ2V)p2exp[12σ2βTβ]

onde é p i = 1 β 2 i .βTβi=1pβi2

Minha probabilidade tem uma distribuição normal para os pontos de dados y da forma p(y|β,σ2)N(Bβ,σ2I)

p(y|β,σ2)=(2πσ2V)n2exp[12σ2(yBβ)T(yBβ)]

(Observe que é uma matriz / vetor, \ bf não funciona.)β

Para obter meu posterior para , combinei o acima, peguei apenas as partes exponenciais e depois expandi para obter:β

.exp[12σ2(yTyyTBββBTyβTBTBβ)]exp[12σ2(βTB)]

Abandonei o termo , pois não é uma função de β .(yTy)β

Colocando em uma expressão sem o exponencial:

.12σ2(yTBββBTyβTBTBβ+βTB)

Eu sei que preciso combinar os termos semelhantes e entrar na forma da distribuição normal multivariada, que é o que pretendo, mas não tenho certeza de como fazer isso? Eu provavelmente tenho que adicionar um termo extra para a expressão para obtê-lo na forma correta?

Nota: Este não é um dever de casa, é um projeto, mas meu conhecimento de trabalho bayesiano não é bom e, portanto, preciso entender o que está acontecendo. Pretendo integrar o e o σ 2 depois de entrar na forma multivariada.βσ2

Ellie
fonte
2
Se você está interessado apenas no cálculo, esse link pode ser interessante.
Pode não ser a sua casa, mas eu acho que me lembro este problema a partir do Gelman et al Bayesian análise de dados livro
David LeBauer
O link para a página da wikipedia acima é o que estou tentando fazer, mas é o verdadeiro trabalho que não sei fazer.
911 Ellie
Estou examinando o livro 'Análise Bayesiana de Dados' e descobri no capítulo 15 que é realmente um layout semelhante ao que estou tentando fazer, mas, novamente, não há trabalho a seguir.
Ellie

Respostas:

13

V

p(β)=N(0,σ2V)p(y|β)=N(Bβ,σ2I)

expββ

logp(β)+const=12σ2βTV1β

logp(y|β)+const=12σ2(βTBTBβ2yTBβ)yTBβ=βTBTy

Adicionados no espaço do log e a coleta de termos semelhantes gera o log não normalizado posteriormente

logp(β|y)+const=12σ2(βT(V1+BTB)β2yTBβ) (1)

xTAx+xTCx=xT(A+C)xxA,C

β

logp(β|y)+const=(βμp)TΛp(βμp)=βTΛpβ2μpTΛpβ+μpTΛpμp

μp,Λp

Bem, por inspeção eqn. (1) se parece muito com este formulário se definirmos

Λp=V1+BTB e μp=Λp1BTy

Em detalhes, podemos mostrar que essa substituição cria cada termo necessário a partir de (1):

βTΛpβ=βT(V1+BTB)β

μpTΛpβ=(Λp1BTy)TΛpβ=yTBΛp1Λpβ=yTBβ

(AB)T=BTAT(Λp1)T=Λp1Λp

μpTΛpμpμp,Λp

logp(β|y)+const=12σ2[(βμp)TΛp(βμp)μpΛpμp]

β

Mike Hughes
fonte
μpTΛpμp