Pergunta : A configuração abaixo é uma implementação sensata de um modelo Hidden Markov?
Eu tenho um conjunto de dados de 108,000
observações (realizadas ao longo de 100 dias) e aproximadamente 2000
eventos ao longo de todo o período de observação. Os dados se parecem com a figura abaixo, onde a variável observada pode assumir 3 valores discretos e as colunas vermelhas destacam os tempos dos eventos, ou seja, 's:
Como mostrado com retângulos vermelhos na figura, eu { a } para cada evento, tratando-os efetivamente como "janelas de pré-evento".
Treinamento do HMM: planejo treinar um modelo de Markov oculto (HMM) com base em todas as "janelas de pré-evento", usando a metodologia de múltiplas seqüências de observação, conforme sugerido na página. 273 de de Rabiner papel . Felizmente, isso me permitirá treinar um HMM que captura os padrões de sequência que levam a um evento.
HMM Previsão: Então eu pretendo usar este HMM para prever em um novo dia, onde será um vector janela deslizante, atualizado em tempo real para conter as observações entre o momento atual e conforme o dia passa.
Espero ver o aumentar para que se assemelham às "janelas de pré-evento". Com efeito, isso deve permitir-me prever os eventos antes que eles aconteçam.
Respostas:
Um problema com a abordagem que você descreveu é que você precisará definir que tipo de aumento de é significativo, o que pode ser difícil, pois P ( O ) sempre será muito pequeno em geral. Pode ser melhor treinar dois HMMs, digamos HMM1 para seqüências de observação em que o evento de interesse ocorre e HMM2 para sequências de observação em que o evento não ocorre. Então, dada uma sequência de observação O, você tem P ( H H M 1 | O )P( O ) P( O ) O
e do mesmo modo para HMM2. Então você pode prever que o evento ocorrerá se
P ( H M M 1 | O )
Isenção de responsabilidade : O que se segue é baseado em minha própria experiência pessoal, então aceite o que é. Uma das coisas boas dos HMMs é que eles permitem lidar com sequências de tamanho variável e efeitos de ordem variável (graças aos estados ocultos). Às vezes isso é necessário (como em muitos aplicativos de PNL). No entanto, parece que você assumiu a priori que apenas as últimas 5 observações são relevantes para prever o evento de interesse. Se essa suposição for realista, você poderá ter significativamente mais sorte usando técnicas tradicionais (regressão logística, bayes ingênuos, SVM, etc) e simplesmente usando as últimas 5 observações como características / variáveis independentes. Normalmente, esses tipos de modelos serão mais fáceis de treinar e (na minha experiência) produzirão melhores resultados.
fonte