Existe uma fórmula de formulário fechado para (ou algum tipo de ligação) no EMD entre e ?x 2 ∼ N ( μ 2 , Σ 2 )
26
Existe uma fórmula de formulário fechado para (ou algum tipo de ligação) no EMD entre e ?x 2 ∼ N ( μ 2 , Σ 2 )
Respostas:
SejaX∼ P= N( μx, Σx) , Y∼ Q = N( μy, Σy) .
Um limite superior mais apertado: considere o acoplamento Este é o mapa derivado por Knott e Smith (1984) , Sobre o mapeamento ideal de distribuições , Journal of Optimization Theory and Applications, 43 (1) pp 39-49 como o mapeamento ideal para ; veja também esta postagem no blog . Observe que eXY∼N(μx,Σx)=μy+Σ−12x(Σ12xΣyΣ12x)12Σ−12xA(X−μx). W2 A=AT EYVarY=μy+A(EX−μx)=μy=AΣxAT=Σ−12x(Σ12xΣyΣ12x)12Σ−12xΣxΣ−12x(Σ12xΣyΣ12x)12Σ−12x=Σ−12x(Σ12xΣyΣ12x)Σ−12x=Σy,
para que o acoplamento seja válido.
A distância é então , onde agora que é normal com∥X−Y∥ ∥D∥ D=X−Y=X−μy−A(X−μx)=(I−A)X−μy+Aμx, EDVarD=μx−μy=(I−A)Σx(I−A)T=Σx+AΣxA−AΣx−ΣxA=Σx+Σy−Σ−12x(Σ12xΣyΣ12x)12Σ12x−Σ12x(Σ12xΣyΣ12x)12Σ−12x.
Portanto, um limite superior para é . Infelizmente, um formulário fechado para essa expectativa é surpreendentemente desagradável para anotações para normais gerais multivariados: veja esta questão , bem como esta .W1(P,Q) E∥D∥
Se a variância de acaba sendo esférica (por exemplo, se , , a variação de se torna ), a primeira pergunta dá a resposta em termos de um polinômio generalizado de Laguerre.D Σx=σ2xI Σy=σ2yI D (σx−σy)2I
Em geral, temos um limite superior simples para base na desigualdade de Jensen, derivada, por exemplo, da primeira pergunta:E∥D∥ (E∥D∥)2≤E∥D∥2=∥μx−μy∥2+tr(Σx+Σy−AΣx−ΣxA)=∥μx−μy∥2+tr(Σx)+tr(Σy)−2tr(Σ−12x(Σ12xΣyΣ12x)12Σ12x)=∥μx−μy∥2+tr(Σx)+tr(Σy)−2tr((Σ12xΣyΣ12x)12)=W2(P,Q)2.
A igualdade no final ocorre porque as matrizes e são semelhantes , então eles têm os mesmos valores próprios e, portanto, suas raízes quadradas têm o mesmo traço.ΣxΣy Σ12xΣyΣ12x=Σ−12x(ΣxΣy)Σ12x
Essa desigualdade é estrita desde que não seja degenerado, como na maioria dos casos, quando .∥D∥ Σx≠Σy
Uma conjectura : Talvez esse limite superior mais próximo, , esteja apertado. Por outro lado, eu tive um limite superior diferente aqui por um longo tempo que ser rígido, que na verdade era mais flexível que o , então talvez você não deva confiar muito nessa conjectura. :)E∥D∥ W2
fonte