Diagnóstico de convergência de Gelman e Rubin, como generalizar para trabalhar com vetores?

14

O diagnóstico Gelman e Rubin é usado para verificar a convergência de várias cadeias mcmc executadas em paralelo. Ele compara a variação dentro da cadeia com a variação entre as cadeias, a exposição é abaixo:

Etapas (para cada parâmetro):

  1. Execute m ≥ 2 cadeias de comprimento 2n a partir dos valores iniciais super dispersos.
  2. Descarte os primeiros n empates em cada cadeia.
  3. Calcule a variação dentro da cadeia e entre as cadeias.
  4. Calcule a variação estimada do parâmetro como uma soma ponderada da variação dentro da cadeia e entre as cadeias.
  5. Calcule o potencial fator de redução de escala.
  6. Item da lista

Eu quero usar esta estatística, mas as variáveis ​​com as quais eu quero usá-la são vetores aleatórios.

Faz sentido usar a média das matrizes de covariância neste caso?

Tim
fonte

Respostas:

17

Uma recomendação: basta calcular o PSRF separadamente para cada componente escalar

O artigo original de Gelman & Rubin [1], bem como o livro Bayesian Data Analysis de Gelman et al. [2], recomenda o cálculo do fator de redução de escala em potencial (PSRF) separadamente para cada parâmetro escalar de interesse. Para deduzir a convergência, é necessário que todos os PSRFs estejam próximos de 1. Não importa que seus parâmetros sejam interpretados como vetores aleatórios, seus componentes são escalares para os quais você pode calcular PSRFs.

Brooks & Gelman [3] propuseram uma extensão multivariada do PSRF, que analiso na próxima seção desta resposta. No entanto, para citar Gelman & Shirley [4]:

[...] esses métodos às vezes podem representar um exagero: parâmetros individuais podem ser bem estimados, embora a convergência aproximada de simulações de uma distribuição multivariada possa demorar muito tempo.

Alternativa: extensão multivariada de Brooks & Gelman

WB

V^=n-1nW+1nB,
nV^,W
R^=maxumaumaTV^umaumaTWuma=n-1n+(m+1m)λ1,
mλ1W-1V^/nλ10 0nR^

Referências

[1] Gelman, Andrew e Donald B. Rubin. "Inferência da simulação iterativa usando várias seqüências." Statistical Science (1992): 457-472.

[2] Gelman, Andrew e outros. Análise de dados bayesianos. Imprensa CRC, 2013.

[3] Brooks, Stephen P. e Andrew Gelman. "Métodos gerais para monitorar a convergência de simulações iterativas." Journal of Computational and Graphical Statistics 7.4 (1998): 434-455.

[4] Gelman, Andrew e Kenneth Shirley. "Inferência de simulações e monitoramento de convergência". (Capítulo 6 em Brooks, Steve, et al., Eds. Handbook of Markov Chain Monte Carlo. CRC Press, 2011.)

Todos os artigos, exceto o livro [2], estão disponíveis no site de Andrew Gelman .

Juho Kokkala
fonte