Como os cientistas apresentam os parâmetros e a topologia corretos do Modelo Hidden Markov para usar?

10

Entendo como um Modelo Markov Oculto é usado em sequências genômicas, como encontrar um gene. Mas não entendo como chegar a um determinado modelo de Markov. Quero dizer, quantos estados o modelo deve ter? Quantas transições possíveis? O modelo deve ter um loop?

Como eles saberiam que seu modelo é ideal?

Eles imaginam, digamos 10 modelos diferentes, comparam esses 10 modelos e publicam o melhor?

Olá Mundo
fonte

Respostas:

6

Estou familiarizado com três abordagens principais:

  1. A priori. Você deve saber que existem quatro pares de bases para escolher e, portanto, permitir que o HMM tenha quatro estados. Ou talvez você saiba que o inglês tem 44 fonemas e, portanto, 44 ​​estados para a camada oculta de fonemas em um modelo de reconhecimento de voz.

  2. Estimativa. O número de estados geralmente pode ser estimado antecipadamente, talvez por simples agrupamento dos recursos observados do HMM. Se a matriz de transição do HMM for triangular (o que geralmente ocorre na previsão de falhas), o número de estados determinará a forma da distribuição do tempo total do estado inicial ao final.

  3. Otimização. Como você sugere, muitos modelos são criados e ajustados e o melhor modelo selecionado. Pode-se também adaptar a metodologia que aprende o HMM para permitir que o modelo adicione ou descarte estados, conforme necessário.

Matthew Graves
fonte
1

Uma outra abordagem é fazer a amostra de modelos com um número infinito de estados. A resposta para "quantos" surgiria calculando a média dos amostradores.

http://mlg.eng.cam.ac.uk/zoubin/papers/ihmm.pdf

conjecturas
fonte