É possível aplicar divergência KL entre distribuição discreta e contínua?

12

Eu não sou um matemático. Eu pesquisei na Internet sobre KL Divergence. O que aprendi é que a divergência KL mede as informações perdidas quando aproximamos a distribuição de um modelo em relação à distribuição de entrada. Eu já vi isso entre duas distribuições contínuas ou discretas. Podemos fazê-lo entre contínuo e discreto ou vice-versa?

prakash
fonte
Veja também: stats.stackexchange.com/q/6907/2970
cardeal

Respostas:

3

Não: a divergência de KL é definida apenas em distribuições em um espaço comum. Ele pergunta sobre a densidade de probabilidade de um ponto sob duas distribuições diferentes, p ( x ) e q ( x ) . Se P é uma distribuição de R 3 e q uma distribuição em Z , então q ( x ) não faz sentido para pontos p R 3 e P ( z ) não faz sentido para pontos z Zxp(x)q(x)pR3qZq(x)pR3p(z)zZ. De fato, não podemos fazer isso para duas distribuições contínuas em espaços de diferentes dimensões (ou discretas, ou em qualquer caso em que os espaços de probabilidade subjacentes não correspondam).

Se você tem um caso particular em mente, pode ser possível criar uma medida similar de dissimilaridade entre distribuições. Por exemplo, pode fazer sentido codificar uma distribuição contínua sob um código para uma distribuição discreta (obviamente com informações perdidas), por exemplo, arredondando para o ponto mais próximo no caso discreto.

Dougal
fonte
Observe que a divergência de KL entre distribuições discretas e absolutamente contínuas está bem definida.
Olivier
@ Olivier A definição usual requer uma medida dominante comum, não?
Dougal 06/06
1
Você está certo quando P e Q são definidos em espaços diferentes. Porém, em um espaço mensurável comum, essa medida sempre existe (por exemplo, P + Q), e a divergência de KL não depende da escolha particular da medida dominante.
Olivier
8

PQXPQfgμ=P+Q

DKL(P,Q)=Xflogfgdμ.

X=[0,1]PQ=δ00f(x)=11x=0g(x)=1x=0

DKL(P,Q)=.
Olivier
fonte
Xflogfgdμ
Teorema da mudança de medida.
Olivier
1

Não em geral. A divergência KL é

DKL(P || Q)=Xlog(dPdQ)dP

PQPQσdPdQ

σ

jtobin
fonte