Existe um método padrão para lidar com o problema de troca de etiquetas na estimativa MCMC de modelos de mistura?

15

A troca de etiquetas (ou seja, a distribuição posterior é invariável à troca de etiquetas de componentes) é um problema problemático ao usar o MCMC para estimar modelos de mistura.

  1. Existe uma metodologia padrão (como amplamente aceita) para lidar com o problema?

  2. Se não houver uma abordagem padrão, quais são os prós e os contras das principais abordagens para resolver o problema de troca de etiquetas?

whuber
fonte
Eu estava pensando em perguntar "Como posso fazer um modelo MCMC da saída no lmer para modelos com inclinações aleatórias?" mas estou me perguntando se essa pergunta é redundante com essa. Ou seja, o "problema de troca de etiqueta" ao usar o MCMC para estimar modelos de mistura é o mesmo tipo de problema que faz com que pvals.fnc () no languageR seja capaz de interceptar modelos, mas não modelos com declives? Caso contrário, informe-me e voltarei a fazer minha pergunta inicial.
russellpierce
@drknexus Eu não sei R para comentar na sua pergunta. Talvez você deva postar sua pergunta com um comentário de que seu qn pode estar alinhado com este.

Respostas:

14

Há uma discussão agradável e razoavelmente recente sobre esse problema aqui:

Christian P. Robert Multimodalidade e troca de etiquetas: uma discussão. Workshop sobre misturas, ICMS, 3 de março de 2010.

Essencialmente, existem várias estratégias padrão, e cada uma tem prós e contras. A coisa mais óbvia a fazer é formular o prior de maneira a garantir que exista apenas um modo posterior (por exemplo, ordenar os meios dos componentes da mistura), mas isso acaba tendo um efeito estranho no posterior, e portanto, geralmente não é usado. Em seguida, ignore o problema durante a amostragem e depois processe a saída para rotular novamente os componentes para manter os rótulos consistentes. Isso é fácil de implementar e parece funcionar bem. As abordagens mais sofisticadas rotulam novamente a etiqueta on-line, mantendo um único modo ou permutando deliberadamente aleatoriamente as etiquetas para garantir a mistura em vários modos. Eu gosto bastante da última abordagem, mas isso ainda deixa o problema de como resumir a saída de forma significativa. No entanto, vejo isso como um problema separado.

Darren Wilkinson
fonte
1
Parece que a ligação é interrompida
Edgar Santos
Corrigi o link encontrando-o no web.archive.org e fornecendo o link para uma cópia dos slides hospedados pelo autor no SlideShare.
Tim
9

Gilles Celeux também trabalhou no problema da troca de etiquetas, por exemplo

G. Celeux, inferência bayesiana para Mistura: o problema de troca de etiquetas. Proceedings Compstat 98 , pp. 227-232, Physica-Verlag (1998).

Como complemento à excelente resposta de @ darrenjw, aqui estão dois artigos on-line que revisaram estratégias alternativas:

  1. Jasra et al., Métodos de Monte Carlo da Cadeia de Markov e o Problema de Troca de Etiquetas na Modelagem de Misturas Bayesianas
  2. Sperrin et al., Estratégias probabilísticas de re-rotulagem para o problema de troca de etiquetas em modelos de mistura bayesiana
chl
fonte