Certo. Esta é essencialmente a observação de que a distribuição de Dirichlet é um conjugado anterior para a distribuição multinomial. Isso significa que eles têm a mesma forma funcional. O artigo menciona isso, mas vou enfatizar que isso decorre do modelo de amostragem multinomial. Então, indo direto ao assunto ...
xKN= ∑Ki = 1xEuxπD i r (α)K
παx
p(π|x,α)=p(x|π)p(π|α)
p(x|π)
p(x|π)=N!x1!⋯xk!πx11⋯πxkk
e
p(π|α)=1B(α)∏i=1Kπα−1i
B(α)=Γ(α)KΓ(Kα)
p(π|α,x)=p(x|π)p(π|α)∝∏i=1Kπxi+α−1i.
Em outras palavras, o posterior também é Dirichlet. A questão era sobre a média posterior. Como o posterior é Dirichlet, podemos aplicar a fórmula da média de um Dirichlet para descobrir que,
E[πi|α,x]=xi+αN+Kα.
Espero que isto ajude!
Como observação lateral, eu também gostaria de acrescentar outro ponto à derivação acima, que não é realmente sobre a questão principal. No entanto, falando sobre os anteriores de Dirichlet na distribuição multinomial, pensei em mencionar que qual seria a forma da função de probabilidade se considerarmos as probabilidades como variáveis incômodas.
fonte