Seja f [x] um pdf de mistura gaussiana com n termos de peso uniforme, meios e variações correspondentes :
Parece intuitivo que a probabilidade de log amostrada nos n centros gaussianos seja maior que (ou igual a) a probabilidade de log média:
Isto é obviamente verdadeiro para pequenas variações (cada está no topo de um gaussiano estreito) e para variações muito grandes (todas as estão no topo de um amplo gaussiano juntos), e isso é verdade para todos os conjuntos de e eu e , mas não consigo descobrir como provar que isso sempre é verdade. Socorro?
machine-learning
gaussian-mixture
Jerry Guern
fonte
fonte
Respostas:
Este é um comentário mais extenso, portanto, tome-o como tal. Defina: (estou usando a notação padrão para distribuições gaussianas).
Você quer provar que: que é {1
Devido à desigualdade de Jensen (ver, por exemplo, Huber et al., On Entropy Approximation for Gaussian Mixture Random Vectors, 2008 ), comgi(x)≡1
fonte
Eu acho que entendi. Leva apenas etapas elementares, embora você precise combiná-las corretamente.
fonte