A maior parte disso é de fundo, pule para o final se você já souber o suficiente sobre as misturas de processos do Dirichlet . Suponha que eu estou modelando alguns dados como provenientes de uma mistura de processos de Dirichlet, ou seja, permita que e condicional em assumam
Aqui e é a medida base anterior. Acontece que, para cada observação , se eu souber o latente associado , a probabilidade de neste modelo é onde é o número de valores distintos de (a medida aleatória é discreta quase certamente). Escobar e West desenvolvem o seguinte esquema para amostragem usando um Gamma anterior; primeiro, eles escrevem
Agora minha pergunta. Por que não podemos simplesmente escrever e vez de usar uma mistura de distribuições Gama, use uma única distribuição Gama? Se introduzirmos o , não devo fazer a mesma coisa, mas sem precisar usar a mistura?
Edite para obter mais detalhes Mais detalhes: Para preencher algumas lacunas, o argumento em Escobar e West é que, deixando ter uma distribuição Gamma com a forma e signifique , e, portanto, podemos introduzir um latente para queOs condicionais completos são uma distribuição para e uma mistura de a e um
Pelo mesmo argumento, obtive o mesmo resultado, mas com para e para . Isso me parece mais fácil; por que eles não fazem isso?