Suponha que tenhamos um conjunto de pontos . Cada ponto é gerado usando a distribuição Para obter posterior para , escrevemos p (x | \ mathbf {y}) \ propto p (\ mathbf {y} | x) p (x) = p (x) \ prod_ {i = 1} ^ N p (y_i x) De acordo com o artigo de Minka na expectativa de propagação precisamos 2 ^ N cálculos para se obter posterior p (x | \ mathbf {y}) e, assim, torna-se intratável problema para a grande amostra tamanhos N . No entanto, não consigo descobrir por que precisamos dessa quantidade de cálculos nesse caso, porque, para um único y_i
Usando esta fórmula, obtemos posterior pela multiplicação simples de , portanto, precisamos apenas de operações e, portanto, podemos resolver esse problema exatamente para tamanhos grandes de amostra.
Faço experimentos numéricos para comparar se realmente obtenho o mesmo posterior no caso de calcular cada termo separadamente e no caso de usar produto de densidades para cada . Os posteriores são os mesmos. Veja onde estou errado? Alguém pode me esclarecer por que precisamos de operações para calcular posteriormente o dado e a amostra ?2 N x y
Respostas:
Você está certo que o jornal está dizendo a coisa errada. Você certamente pode avaliar a distribuição posterior de em um local conhecido usando operações . O problema é quando você deseja calcular momentos do posterior. Para calcular exatamente a média posterior de , você precisaria de operações. Esse é o problema que o jornal está tentando resolver.O ( n ) x 2 Nx O(n) x 2N
fonte
Você perdeu o ponto de que a distribuição é uma mistura de gaussianos: cada amostra é distribuída conforme com probabilidade e como (distribuição de desordem para , independente de ) com probabilidade .yi p(yi|x) 1−w pc(y) y x w
Seja a variável indicadora indicando que a amostra foi extraída da distribuição de desordem; portanto, se for , indica que a amostra foi retirada de . Obviamente, se a amostra foi retirada da distribuição de desordem, seu valor é irrelevante para a estimativa de .ci i 0 p(y|x) x
É a presença dos possíveis estados conjuntos para essas variáveis indicadoras que causam o problema.2N
fonte