Atualmente, estou estimando parâmetros de um modelo definido por várias equações diferenciais ordinárias (ODEs). Eu tento isso com uma abordagem bayesiana aproximando a distribuição posterior dos parâmetros dados alguns dados usando a cadeia de Markov Monte Carlo (MCMC).
Um amostrador MCMC gera uma cadeia de valores de parâmetros em que utiliza a probabilidade posterior (não normalizada) de um determinado valor de parâmetro para decidir (estocisticamente) se irá adicionar esse valor à cadeia ou adicionar o valor anterior novamente. Porém, parece ser a prática que as probabilidades posteriores reais não precisam ser salvas, mas sim um histograma n-dimensional dos valores de parâmetros resultantes gerados e estatísticas resumidas como regiões de maior densidade (HDRs) de uma ditribuição posterior de parâmetro são calculadas deste histograma. Pelo menos foi o que acho que aprendi com o livro tutorial de Kruschkes sobre inferência bayesiana .
Minha pergunta: não seria mais simples salvar as probabilidades posteriores dos valores dos parâmetros amostrados junto com eles e aproximar a distribuição posterior desses valores e não das frequências dos valores dos parâmetros na cadeia MCMC? O problema da fase de queima não surgiria, pois o amostrador ainda amostraria regiões de baixa probabilidade com mais freqüência do que "mereceria" por suas probabilidades posteriores, mas não seria mais o problema de atribuir valores de probabilidade indevidamente altos a elas.
Respostas:
Esta é uma pergunta interessante, com diferentes questões:
fonte
Como você notou corretamente, as probabilidades com as quais estamos lidando não são normalizadas . Basicamente, usamos o MCMC para calcular o fator de normalização no teorema de Bayes. Não podemos usar as probabilidades porque elas não são normalizadas. O procedimento que você sugere: salvar as probabilidades não normalizadas e depois dividi-las pela soma está incorreto.
você também tem probabilidades correspondentes:
Nesse caso, as probabilidades são normalizadas, mas dividi-las por sua soma (que por axiomas de probabilidade é igual a unidade) não deve mudar nada. Infelizmente, usando o procedimento que faz mudar os resultados de:
Por que é que? A resposta é simples: em sua amostra, cada "probabilidade" salva
f
aparece com probabilidadef
; portanto, você está ponderando as probabilidades por conta própria!fonte