Como provar essa desigualdade da mistura gaussiana? (Montagem / sobreajuste)

8

Seja f [x] um pdf de mistura gaussiana com n termos de peso uniforme, meios e variações correspondentes :{μ1,...,μn}{σ1,...,σn}

f(x)1ni=1n12πσi2e(xμi)22σi2

Parece intuitivo que a probabilidade de log amostrada nos n centros gaussianos seja maior que (ou igual a) a probabilidade de log média:

1nj=1nln(f(μj))f(x)ln(f(x))dx

Isto é obviamente verdadeiro para pequenas variações (cada está no topo de um gaussiano estreito) e para variações muito grandes (todas as estão no topo de um amplo gaussiano juntos), e isso é verdade para todos os conjuntos de e eu e , mas não consigo descobrir como provar que isso sempre é verdade. Socorro?μiμiμiσEu

Jerry Guern
fonte
Você provavelmente está perdendo uma expectativa no LHS?
lacerbi
@lacerbi Não, eu não sou. Nada está faltando. Nas LHS, o é avaliada no indexada 'sx if(x)xi
Jerry Guern
Sim, desculpe - eu estava com muito sono e interpretei mal a definição.
181116 lacerbi

Respostas:

2

Este é um comentário mais extenso, portanto, tome-o como tal. Defina: (estou usando a notação padrão para distribuições gaussianas).

f(x)1ni=1nN(x|xi,σi2)

Você quer provar que: que é {1

1ni=1nlogf(xi)f(x)logf(x)dx0
{1ni=1nlogf(xi)}+H[f]0.

Devido à desigualdade de Jensen (ver, por exemplo, Huber et al., On Entropy Approximation for Gaussian Mixture Random Vectors, 2008 ), comgi(x)1

H[f]1ni=1nlogf(x)N(x|xi,σi2)dx=1ni=1nloggi(xi)
, que vem da convolução de duas densidades gaussianas. Então temos: {1gEu(x)1nj=1nN(x|xj,σEu2+σj2) Curiosamente, ogiainda são misturas de Gaussianas com meios de componentes iguais aos daf, mas cada componente degitem uma variância estritamente maior do que o seu correspondente componente emf. Você pode fazer alguma coisa com isso?
{1nEu=1nregistrof(xEu)}+H[f]1nEu=1nregistrof(xEu)gEu(xEu).
gEufgEuf
lacerbi
fonte
Obrigado. Parece que eu teria que provar que o RHS final é> = 0, o que também parece intuitivo, mas difícil de provar, mas esse é realmente um passo na direção certa. Eu já vi esse jornal antes.
precisa
É tentador pensar que o RHS final é sempre positivo, mas também não posso provar isso.
Jerry Guern
0

Eu acho que entendi. Leva apenas etapas elementares, embora você precise combiná-las corretamente.

fEuEu12πσEu2e(x-μEu)22σEu2

g(x)=xeuog(x)f(x)registro(f(x))1nEu=1nfEu(x)registro(fEu(x))

f(x)registro(f(x))dx1nEu=1nfEu(x)registro(fEu(x))dx

EuffEu

euog(f(μEu))euog(fEu(μEu))
1nEu=1neuog(f(μEu))1nEu=1neuog(fEu(μEu))
1nEu=1neuog(fEu(μEu))1nEu=1nfEu(x)registro(fEu(x))
euog(fEu(μEu))=fEu(x)euog(fEu(μEu))dxfEu(x)euog(fEu(x))dx
Eun
sjm.majewski
fonte
Estou confuso. Você definiu ag (x), mas nunca o usou, e eu não sei o que seu f_i significa.
Jerry Guern
fEugg(1nEu=1nfEu(x))1nEu=1ng(fEu(x))
f> =fEu1/nfEu
1
1nEu=1neuog(f(μEu))1nEu=1neuog(fEu(μEu))
1
Sim, eu percebi isso ontem. Parece que essa desigualdade é bastante difícil, deixarei minha resposta de qualquer maneira com uma edição.
Sjm.majewski