Estou lendo artigos de pesquisa usando os métodos MCMC e vejo a maioria deles fornecendo traços. Por que precisamos de traços na cadeia Markov Monte Carlo? O que indica um gráfico de rastreamento de parâmetros?
fonte
Estou lendo artigos de pesquisa usando os métodos MCMC e vejo a maioria deles fornecendo traços. Por que precisamos de traços na cadeia Markov Monte Carlo? O que indica um gráfico de rastreamento de parâmetros?
Você cria os gráficos de rastreio de parâmetros para garantir que sua distribuição a priori seja bem calibrada, o que é indicado por seus parâmetros terem alterações suficientes de estado à medida que o algoritmo MCMC é executado.
Um exemplo extremo é que você define sua variação de distribuição a priori em 0. Então a estimativa do parâmetro posterior nunca será alterada. Seu algoritmo diria que você tem a melhor estimativa de parâmetro, mas não verificou um número suficiente de parâmetros para determinar se esse é realmente o melhor ajuste. Se você definir uma variação de distribuição a priori muito alta, obterá um problema semelhante. Isso ocorre porque é menos provável que o novo parâmetro esteja relacionado aos seus dados - portanto, a probabilidade de log calculada com seu novo parâmetro provavelmente não será melhor que a probabilidade de log usando o parâmetro antigo. (Um exemplo é se o parâmetro "true" for 0,5 e sua estimativa inicial for 2, mas você estiver selecionando uma distribuição normal com média de 2 e variação de 10.000, é improvável que obtenha um parâmetro mais próximo de 1 .
Você precisa selecionar uma variação a priori que permita que seus estados de parâmetro sejam alterados o suficiente para não ficarem presos aos mínimos e máximos locais na distribuição de probabilidade de log, mas ainda assim suficientemente bem para obter estimativas razoáveis de parâmetros. A maior parte da literatura sugere que você obtenha seus parâmetros para mudar de estado 40-60% das vezes.
Uma outra razão para as plotagens de rastreio é a queima. Geralmente, a queima no período é óbvia na plotagem (por exemplo, se o parâmetro true for 1,5 e sua estimativa inicial for 4, você deverá ver as estimativas de parâmetros se movendo rapidamente de 4 para 1,5 e depois "saltando" em torno de 1,5). Normalmente, você apenas exclui as primeiras n iterações em que n é grande o suficiente para remover a queimadura (por exemplo, 1000), mas se os cálculos forem demorados ou se suas estimativas de parâmetros estiverem demorando muito mais para convergir do que n permite que você queira omitir mais ou menos observações para explicar a queima. Você pode verificar seus gráficos para ver onde a queima no período termina para garantir que a queima não esteja afetando seus resultados.
Observe que eu tenho falado no contexto de estimativas de pontos de parâmetro. Se você estiver estimando a variação dos parâmetros, garantir que você tenha alterações de estado apropriadas é ainda mais importante.