Do HMM padrão ao HMM Bayesiano

8

Estou tentando entender qual é a diferença entre um HMM padrão e um HMM Bayesiano. A Wikipedia menciona brevemente como é o modelo, mas preciso de um tutorial mais detalhado. Alguém conhece um documento ou uma implementação que eu possa examinar?

Também tenho problemas com a terminologia usada. O que significa praticamente se você "coloca / coloca um Dirichlet antes de uma distribuição"?

Laughingman
fonte
1
Você está familiarizado com distribuições anteriores e posteriores? Caso contrário, leia um exemplo de inferência bayesiana em dados binomiais (ou seja, dada uma sequência observada de lançamentos de moedas, inferir a probabilidade de cabeças) , então é uma generalização direta para dados multinomiais (ou seja, dados alguns testes de uma tendência) Dado do lado , inferir a probabilidade de observar cada lado). O último problema, que envolve "colocar um Dirichlet anterior" no vetor de probabilidade, é a mesma inferência que se faz com um HMM Bayesiano. K
Jerad
Aqui está um artigo breve e bom sobre os HMMs bayesianos para marcação de parte do discurso, com uma ótima explicação de por que a abordagem bayesiana é útil.
Jerad
Então, alguém pode dar um exemplo de como seria? No sentido de um dado de 6 lados, o vetor de probabilidade uniforme seria {1/6, 1/6, 1/6, 1/6, 1/6, 1/6}, certo? E significaria se eu colocasse um Dirichlet Prior nisso?
Laughingman

Respostas:

2

Em termos do Dirichlet anterior, acredito que esteja dizendo que você tem um conjunto de variáveis ​​que são todas as porcentagens / proporções entre 0 e 1 e todas somam 1. (Isso é que e ..) No caso dos HMM, isso poderia ser usado para modelar a probabilidade de transição para um dos estados possíveis ou a probabilidade de emitir um dos símbolos possíveis.nx1xn0xi1xi=1nn

A página da Dirichlet na wikipedia diz isso muito bem, especialmente a seção intitulada "Conjugar com categoria / multinomial".

Wayne
fonte