Estou tentando um modelo muito simples: encaixando um Normal onde suponho que conheço a precisão e só quero encontrar a média. O código abaixo parece se encaixar no Normal corretamente. Porém, após o ajuste, quero fazer uma amostra do modelo, ou seja, gerar novos dados semelhantes à minha data
variável. Eu sei que posso usar trace("mean")
para obter amostras para a variável média. Mas como posso obter novas amostras do próprio modelo?
Analisei documentos, por exemplo, http://pymc-devs.github.io/pymc/database.html#accessing-sampled-data . Também observei alguns exemplos, por exemplo, os desastres de mineração e vários dos cadernos de programação probabilística, e nenhum menciona isso. Eu (mais ou menos um iniciante do MCMC) esperava que a amostragem do modelo ajustado fosse o ponto principal! o que estou perdendo?
from pymc import *
data = np.array([-1, 0, 4, 0, 2, -2, 1, 0, 0, 2, 1, -3, -1, 0, 0, 1, 0, 1])
mean = Uniform("mean", -4, 4)
precision = 2.0**-2
obs = Normal("obs", mean, precision, value=data, observed=True)
model = Model( {"mean": mean, "obs": obs})
mcmc = MCMC(model)
mcmc.sample(10000, 1000, 1)
# I can get samples for the "mean" variable
mean_samples = mcmc.trace("mean")[:]
hist(mean_samples)
# but how can I do the equivalent of mcmc.trace("obs")?
Respostas:
Você está procurando o que é chamado de distribuição preditiva . Incluir isso é muito simples. Antes de criar o
Model
, adicione a variável estocástica adicional:Isso irá gerar dados artificiais a partir do modelo ajustado. Obrigado por chamar minha atenção para essa supervisão, vou incluí-la no projeto BMH.
fonte
Chegou aqui vários anos depois, ao procurar a mesma coisa usando o PyMC3, por isso vou deixar uma resposta relevante para a nova versão: (das verificações preditivas posteriores ).
fonte