Ao executar o algoritmo Metropolis-Hastings com distribuições uniformes de candidatos, qual é a lógica de ter taxas de aceitação em torno de 20%?
Meu pensamento é: uma vez que os valores dos parâmetros true (ou quase true) sejam descobertos, nenhum novo conjunto de valores de parâmetros candidatos do mesmo intervalo uniforme aumentaria o valor da função de probabilidade. Portanto, quanto mais iterações eu executar, menores as taxas de aceitação que devo obter.
Onde estou errado nesse pensamento? Muito Obrigado!
Aqui está a ilustração dos meus cálculos:
onde é a probabilidade do log.
Como os candidatos são sempre retirados do mesmo intervalo uniforme,
Portanto, o cálculo da taxa de aceitação diminui para:
A regra de aceitação de é então a seguinte:
fonte
Respostas:
Acredito que a convergência fraca e o dimensionamento ideal dos algoritmos Metropolis de passeio aleatório de Roberts, Gelman e Gilks são a fonte da taxa de aceitação ideal de 0,244.
O que o artigo mostra é que, sob certas suposições, é possível dimensionar o algoritmo de caminhada aleatória Metropolis-Hastings à medida que a dimensão do espaço vai para o infinito para obter uma difusão limitante para cada coordenada. No limite, a difusão pode ser vista como "mais eficiente" se a taxa de aceitação assumir o valor 0,244. Intuitivamente, é uma troca entre fazer muitas pequenas etapas aceitas e fazer muitas propostas grandes que são rejeitadas.
O algoritmo Metropolis-Hastings não é realmente um algoritmo de otimização, em contraste com o recozimento simulado. É um algoritmo que deve simular a partir da distribuição de destino, portanto, a probabilidade de aceitação não deve ser direcionada para 0.
fonte
Apenas para adicionar uma resposta por @NRH. A ideia geral segue o princípio Goldilocks :
Obviamente, a questão é: o que queremos dizer com "exatamente correto". Essencialmente, para um caso específico, eles minimizam a distância esperada do salto quadrado. Isso é equivalente a minimizar as autocorrelações lag-1. Recentemente, Sherlock e Roberts mostraram que a mágica 0,244 vale para outras distribuições de destino:
fonte
Estou adicionando isso como resposta, porque não tenho reputação suficiente para comentar sobre a pergunta. Eu acho que você está confuso entre taxa de aceitação e taxa de aceitação .
Agora, sua dúvida de que a taxa de aceitação ideal é de 20% é realmente sobre a taxa de aceitação real, não a taxa de aceitação. A resposta é dada nas outras respostas. Eu só queria apontar a confusão que você está tendo.
fonte