Traçando uma "superfície mediana posterior"

8

Como parte da reprodução de um modelo que descrevi parcialmente nesta questão no Stack Overflow, quero obter um gráfico de uma distribuição posterior. O modelo (espacial) descreve o preço de venda de algumas propriedades como uma distribuição de Bernoulli, dependendo de a propriedade ser cara (1) ou barata (0). Nas equações:

p i ~ logit - 1 ( b 0 + b 1 livingarea / 1000 + b 2 Idade + w ( s ) ) w ( s ) ~ MVN ( 0 , Σ )

yEuBernoulli(pEu)
pEulogit-1(b0 0+b1Sala-de-estar/1000+b2Era+W(s))
W(s)MVN(0 0,Σ)

onde é o resultado binário 1 ou 0, é a probabilidade de ser barato ou caro, é uma variável aleatória espacial em que representa sua posição . Tudo isso para cada porque existem 70 propriedades no conjunto de dados. é uma matriz de covariância baseada na posição geográfica dos pontos de dados. Se você estiver curioso sobre esse modelo, o conjunto de dados pode ser encontrado aqui . p i w ( s ) s i = { 1 , . . . , 70 } ΣyEupEuW(s)sEu={1,...,70}Σ

A plotagem que desejo obter é a seguinte plotagem de contorno:

insira a descrição da imagem aqui

A figura é descrita como "Gráfico da imagem da superfície mediana posterior do processo latente , modelo espacial binário". O livro também diz o seguinte:W(s)

A Figura 5.8 mostra o gráfico da imagem com linhas de contorno sobrepostas para a superfície média posterior do processo latente .W(s)

No entanto, existem apenas 70 pares de pontos no conjunto de dados. Suponho que, para produzir um gráfico de contorno, preciso estimar em 70 * 70 pontos. Então, minha pergunta é: como produzo essa superfície mediana posterior? Até agora, tenho amostras de distribuições posteriores para todos os parâmetros envolvidos (usando PyMC) e sei que posso prever em um novo ponto usando a distribuição preditiva posterior. No entanto, não sei como prever valores em um novo ponto . Talvez eu esteja errado e o enredo não tenha sido construído por previsão, mas por interpolação.W(s)yW(s)s

ATUALIZAÇÃO :

Primeiro, esta é a mediana da distribuição posterior de em cada local onde há uma propriedade. Isso é baseado no rastreio do MCMC para .W(s)W

insira a descrição da imagem aqui

E esta é a interpolação (com um gráfico de contorno) usando uma função de base radial:

insira a descrição da imagem aqui

(Se você estiver interessado no código, me avise)

Como você pode ver, existem diferenças significativas nas parcelas. Algumas perguntas:

  1. Como posso saber se essas diferenças são explicadas pelo procedimento de interpolação?

  2. Talvez haja variações importantes na distribuição posterior de que calculei e a mostrada no livro. Quanta variação é aceitável entre as simulações do MCMC? Até meus próprios parâmetros mudam um pouco, dependendo da amostra que eu uso (Metropolis, Metropolis Adaptive.)W(s)

  3. Existe algum procedimento bayesiano para prever pontos , a fim de gerar um gráfico de contorno, como fiz usando a função de base radial?W(s)

Robert Smith
fonte
1
Interpolação é previsão! (Como é um processo, apresentar um valor de em qualquer local não observado equivale a adivinhar o valor de uma variável aleatória. Previsão, por definição, adivinha o valor de uma variável aleatória.)WW
whuber
Certo. Eu quis dizer interpolação em oposição à previsão bayesiana. A propósito, tentei usar a interpolação com o vizinho mais próximo e obtive resultados terríveis.
Robert Smith
WyEu
W(s)
sW(s)

Respostas:

1

É muito provável que o autor tenha utilizado um processo gaussiano para produzir a interpolação. Eu acho que isso é verdade porque um exercício do livro descreve um problema muito semelhante a este e requer uma trama baseada em um processo gaussiano.

W(s)

insira a descrição da imagem aqui

E esta é a interpolação baseada em um processo gaussiano:

insira a descrição da imagem aqui

Como você pode ver, o método de interpolação faz uma enorme diferença.

Robert Smith
fonte