Digamos que tenho o seguinte modelo:
E deduzo os posteriores para e mostrados abaixo a partir dos meus dados. Existe uma maneira bayesiana de dizer (ou quantificar) se e são iguais ou diferentes ?λ 2 λ 1 λ 2
Talvez medindo a probabilidade de que seja diferente deλ 2 ? Ou talvez usando divergências KL?
Por exemplo, como posso medir ou pelo menos ?p ( λ 2 > λ 1 )
Em geral, depois que você mostra os posteriores abaixo (assuma valores PDF diferentes de zero em qualquer lugar para ambos), qual é uma boa maneira de responder a essa pergunta?
Atualizar
Parece que esta pergunta pode ser respondida de duas maneiras:
Se tivermos amostras das posteriores, poderemos examinar a fração das amostras em que (ou equivalente ). O @ Cam.Davidson.Pilon incluiu uma resposta que resolveria esse problema usando essas amostras.λ 2 > λ 1
Integrando algum tipo de diferença dos posteriores. E essa é uma parte importante da minha pergunta. Como seria essa integração? Presumivelmente, a abordagem de amostragem aproximaria essa integral, mas eu gostaria de saber a formulação dessa integral.
Nota: Os gráficos acima são provenientes deste material .
fonte
Respostas:
Eu acho que uma pergunta melhor é : eles são significativamente diferentes?
Para responder a isso, precisamos calcular . Chame essa quantidade . Se , há chances iguais de que um seja maior que o outro. Por outro lado, se estiver realmente próximo de 1, podemos ter certeza de que sim é maior (leia-se: diferente) que .P(λ2>λ1) p p≈0.50 p λ2 λ1
Como computamos ? É trivial em uma estrutura Bayesian MCMC. Como temos amostras do posterior, vamos calcular a probabilidade de que as amostras de sejam maiores que :p λ2 λ1
Peço desculpas por não ter incluído isso no livro, vou adicioná-lo definitivamente, pois acho que é uma das idéias mais úteis na inferência bayesiana
fonte
np.mean( lambda_2_samples != lambda_1_samples)
Como afirmado, essa pergunta é trivial. Supondo que e são variáveis aleatórias contínuas, .λ1 λ2 Pr(λ1=λ2)=0
Eu suspeito que você esteja interessado na probabilidade de que e estejam a alguns um do outro. Nesse caso, a área da diferença nas duas densidades posteriores no intervalo é a sua resposta. Valores maiores de sobreposição indicam que os dois posteriores são mais semelhantes.λ 2 ϵ [ - ϵ / 2 , ϵ / 2 ]λ1 λ2 ϵ [−ϵ/2,ϵ/2]
Se você preferir trabalhar com resultados simulados (e para a maioria dos problemas, não temos o luxo de escolher), basta considerar a proporção dos resultados em que como uma aproximação.λ2>λ1
fonte