Amostragem de distribuição marginal usando distribuição condicional?

12

Eu quero provar de uma densidade univariada mas eu só sei o relacionamento:fX

fX(x)=fX|Y(x|y)fY(y)dy.

Eu quero evitar o uso do MCMC (diretamente na representação integral) e, como e são fáceis de amostrar, eu estava pensando em usar o seguinte amostrador :fX|Y(x|y)fY(y)

  1. Para .j=1 1,,N
  2. Amostra .yjfY
  3. Exemplo de .xjfX|Y(|yj)

Então, terminarei com os pares e apenas as amostras marginais . Isso está correto?(x1 1,y1 1),...,(xN,yN)(x1 1,,xN)

Cajado
fonte

Respostas:

10

Sim isto está correcto. Basicamente, você tem

fX,Y(x,y)=fX|Y(x|y)fY(y),

e como você disse, você pode colher amostras da densidade das articulações. A coleta apenas dos s das amostras leva a uma amostra da distribuição marginal.x

Isso ocorre porque o ato de ignorar o é semelhante à integração sobre ele. Vamos entender isso com um exemplo.y

Suponha que = Altura das mães e Y = Altura da filha. O objetivo é obter uma amostra de ( X , Y ) para entender a relação entre as alturas das filhas e de suas mães. (Estou assumindo que há apenas uma filha na família e restringindo a população a todas as filhas acima de 18 anos para garantir o crescimento total).XY(X,Y)

Você sai e obtém uma amostra representativa

(x1 1,y1 1),,(xN,yN).

Assim, para cada mãe, você tem a altura da filha deles. Deve haver uma relação clara entre e Y . Agora, suponha que, no seu conjunto de dados, você ignore todos os dados das filhas (solte o Y ), então o que você tem? Você tem exatamente alturas de mães escolhidos aleatoriamente, que será N tira da marginal de X .XYYNX

Greenparker
fonte
Obrigado por isso, isso é útil. Você sabe se essa estratégia de amostragem pode ser vinculada à amostragem de Gibbs para justificá-la formalmente?
Rod
11
yxyy
11
Greenparker, mas existe uma prova formal dessa afirmação, ou seja, considerando que apenas parte da amostra retirada da articulação fornece uma amostra do marginal?
Um velho no mar.
A amostragem de "X = mães" por amostragem (X, Y) e coleta de X na verdade fornece amostras de "mães que têm exatamente uma filha totalmente crescida", o que não é o mesmo que "mães". Mas mesmo se mudarmos seu exemplo para dizer que você está interessado em "X = mães que têm exatamente uma filha totalmente crescida", chegar a X por amostragem (X, Y) inclina sua amostra com base na distribuição de Y. p (v ) = ∑ (u no suporte (U)) (p (u, v))) = ∑ (u no suporte (U)) (p (v | u) * p (u))) = (1 / sampleSize ( u)) * ∑ (u na amostra (U)) (p (v | u)))), porque cada valor de u aparece na amostra com probabilidade p (u) - portanto, é necessário calcular a média de p (v | u) draws
radumanolescu 23/02