A troca de etiquetas (ou seja, a distribuição posterior é invariável à troca de etiquetas de componentes) é um problema problemático ao usar o MCMC para estimar modelos de mistura.
Existe uma metodologia padrão (como amplamente aceita) para lidar com o problema?
Se não houver uma abordagem padrão, quais são os prós e os contras das principais abordagens para resolver o problema de troca de etiquetas?
Respostas:
Há uma discussão agradável e razoavelmente recente sobre esse problema aqui:
Essencialmente, existem várias estratégias padrão, e cada uma tem prós e contras. A coisa mais óbvia a fazer é formular o prior de maneira a garantir que exista apenas um modo posterior (por exemplo, ordenar os meios dos componentes da mistura), mas isso acaba tendo um efeito estranho no posterior, e portanto, geralmente não é usado. Em seguida, ignore o problema durante a amostragem e depois processe a saída para rotular novamente os componentes para manter os rótulos consistentes. Isso é fácil de implementar e parece funcionar bem. As abordagens mais sofisticadas rotulam novamente a etiqueta on-line, mantendo um único modo ou permutando deliberadamente aleatoriamente as etiquetas para garantir a mistura em vários modos. Eu gosto bastante da última abordagem, mas isso ainda deixa o problema de como resumir a saída de forma significativa. No entanto, vejo isso como um problema separado.
fonte
Gilles Celeux também trabalhou no problema da troca de etiquetas, por exemplo
Como complemento à excelente resposta de @ darrenjw, aqui estão dois artigos on-line que revisaram estratégias alternativas:
fonte