Desenhando amostras de uma mistura finita de distribuições normais?

10

Após algumas etapas de atualização bayesiana, fiquei com uma distribuição posterior da forma de uma mistura de distribuições normais,Ou seja, o parâmetro \ theta é obtido de uma distribuição cujo PDF é fornecido como uma mistura ponderada de PDFs normais e não é uma soma dos RVs normais. Eu gostaria de desenhar amostras \ theta \ sim \ Pr (\ theta | \ text {data}) para usar em uma aproximação de amostragem importante deste posterior. Na prática, a soma sobre i pode ter um grande número de termos, para que seja impraticável escolher um termo i de acordo com os pesos \ {w_i \} e depois desenhar \ theta \ sim N (\ mu_i, \ sigma ^ 2)

Pr(θ|data)=i=1kwiN(μi,σ2).
θ Pr ( θ | dados ) i i { w i } θ N ( μ i , σ 2 )θθPr(θ|data)ii{wi}θN(μi,σ2). Existe uma maneira eficiente de extrair amostras de um posterior deste formulário?
Chris Granade
fonte
Você já tentou o método select then throw? A seleção pode ser feita razoavelmente rápido dos O (k) passos seguintes.
dmckee --- ex-moderador gatinho
11
Se a solução da Barron realmente não está correta e você de fato quer dizer um "modelo de mistura", poderia usar esse termo?
Neil G
11
Neil G: Eu não sou um estatístico de profissão, mas um físico que às vezes precisa fazer uso de estatística. Como tal, não conhecia o termo apropriado para descrever o que precisava. No entanto, posso continuar e editar a pergunta agora, para deixar mais claro que os PDFs estão sendo somados e não os RVs.
Chris Granade
11
@ ChrisGranade: Eu não estava tentando te atacar. Eu só queria ter certeza de que era isso o que você queria dizer e sugerir a edição.
Neil G
11
Por que é impraticável escolher base nos pesos e em uma amostra da distribuição uniforme em , depois na amostra ? Isso é apenas moderadamente mais caro do que amostrar uma única distribuição normal, o custo é independente do número de distribuições mistas e não depende dessas distribuições serem normais. { w i } [ 0 , 1 ] N ( μ i , σ 2 ) ki{wi}[0,1]N(μi,σ2)k
Jed Brown

Respostas:

6

Em princípio, pode-se pré-selecionar o número de amostras a serem retiradas de cada subdistribuição, depois visitar cada subdistribuição apenas uma vez e desenhar o número de pontos.

Isso é

  1. Encontre o conjunto aleatório forma que e respeitando os pesos.n = Σ k i = 1 n i<n1,n2,,nk>n=i=1kni

    Acredito que você faça isso desenhando uma distribuição Poisson uma distribuição multinomial (veja os comentários) da média para cada subdistribuição e normalizando a soma para .nwinn

    O trabalho aqui éO(k)O(n)

  2. Então faça

    for (i=1; i<=k; ++i)
       for (j=1; j<=n[i]; ++j)
          theta ~ N(mu[i],sigma[i])
    

    O trabalho aqui éO(n)

Embora isso signifique que você não recebe a ordem aleatoriamente. Se a ordem aleatória for necessária, você deve embaralhar os draws (também grande ).O(n)

Parece que o primeiro passo é dominar em tempo de execução e da mesma ordem que o algoritmo ingênuo, mas se você tiver certeza de que todo o poderá aproximar as distribuições de Poisson das distribuições normais e acelerar o primeiro passo.win1

dmckee --- gatinho ex-moderador
fonte
A distribuição do não é uma distribuição de Poisson se for fixo, mas uma distribuição binomial. nnin
Frédéric Grosshans
@ FrédéricGrosshans Uhm ... aqui é onde eu admito minha fraqueza angustiante em probabilidade. Olhando, acho que você pode estar certo. Não tenho um link para lançar distribuições binomiais arbitrárias, mas a wikipedia tem algumas referências . Há também uma relação entre Poisson e Binomial, que vou afirmar ser responsável pela minha incerteza. Sim, esse é o bilhete.
dmckee --- ex-moderador gatinho
11
@dmckee: Boa resposta para a elaboração de um modelo de mistura, exceto que ele deve ser uma distribuição multinomial, em vez de uma distribuição de Poisson na etapa 1.
Neil G
3

Nota: A versão original desta pergunta perguntou sobre uma "soma ponderada de distribuições normais" para a qual a resposta a seguir pode ser útil. No entanto, após uma boa discussão sobre essa resposta, a resposta de @Geoff e a própria pergunta, ficou claro que a pergunta estava realmente na amostragem de uma "mistura de distribuições normais" à qual essa resposta não é aplicável.


A soma das distribuições normais é uma distribuição normal, portanto, você pode calcular os parâmetros dessa distribuição única e simplesmente tirar amostras disso. Se chamarmos essa distribuição , então,N(μsum,σsum2)

μsum=i=1kwiμi

σsum2=i=1kwi2σi2
Barron
fonte
3
Para resumir, Chris está somando funções de densidade de probabilidade, não variáveis ​​aleatórias.
Geoff Oxberry
2
Chris quer um PDF com (pelo menos em princípio) vários solavancos. Ou seja, ele era a soma dos PDFs, não o PDF de uma soma.
dmckee --- ex-moderador gatinho
11
É verdade que a soma de variáveis ​​aleatórias distribuídas normalmente é ela própria uma variável aleatória distribuída normalmente. No entanto, a soma das distribuições normais não é uma distribuição normal. Portanto, se e , é verdade que , mas . (Crédito vai para @ChrisGranade para a explicação.)X1N(μ1,σ12)X2N(μ2,σ22)X1+X2N(μ1+μ2,σ12+σ22)PDF(X1+X2)PDF(X1)+PDF(X2)
Geoff Oxberry
2
@dmckee: não é uma "soma ponderada de distribuições normais", é uma "mistura de distribuições normais".
Neil G
2
Os comentários do @Barron não são considerados uma parte essencial da página. Você definitivamente deve editar sua resposta para incluir a essência dos comentários, para que os leitores que não olham para os comentários não sejam enganados.
David Ketcheson
2

Atualização : Esta resposta está incorreta, decorrente de confusão na terminologia (consulte a cadeia de comentários abaixo para obter detalhes); Só estou deixando isso como um guia para que as pessoas não repassem essa resposta (além de Barron). Por favor, não vote para cima ou para baixo.

Eu apenas usaria propriedades de variáveis ​​aleatórias para reduzi-lo a uma única variável aleatória normalmente distribuída. A soma de duas variáveis ​​aleatórias independentes distribuídas normalmente é ela própria uma variável aleatória , portanto, se e , entãoX1N(μ1,σ12)X2N(μ2,σ22)

X1+X2N(μ1+μ2,σ12+σ22).

Além disso, se , entãow1R

w1X1N(w1μ1,w12σ12).

Usando esses dois resultados combinados,

Pr(θ|data)N(i=1kwiμi,i=1kwi2σi2).

Portanto, nesse caso, você só precisará extrair amostras de uma única distribuição, o que deve ser muito mais tratável.

Geoff Oxberry
fonte
2
Esta é a solução para um problema diferente, que pode ser visto pelo fato de a distribuição original ser multimodal e sua sugestão ser unmodal.
31812 Chris Ferrie
@ ChrisFerrie: Eu acredito em você, mas com base na notação, estou confuso sobre o motivo pelo qual a distribuição acima seria multimodal, enquanto a soma de duas variáveis ​​aleatórias gaussianas independentes não seria. O que estou perdendo aqui?
Geoff Oxberry
Acho que a confusão é que não estamos vendo uma soma de variáveis ​​aleatórias, mas um PDF que é a soma de muitos PDFs. Nem sempre são os mesmos, pois . Em vez disso, nosso PDF pode ser considerado marginalizante sobre a variável aleatória . ip(X1+X2)p(X1)+p(X2)i
Chris Granade
Ah, você está vendo somas de PDFs. Sim, isso é um animal completamente diferente. Agora que li a pergunta mais de perto, entendi o que você está dizendo e vou excluir minha resposta. Obrigado!
Geoff Oxberry
Anulei minha resposta excluída anteriormente apenas para servir como guia para os outros, para que ninguém mais responda a essa pergunta como Barron e eu. Por favor, não vote mais na minha resposta.
Geoff Oxberry