Por que o PDF da Dirichlet Distribution parece não ser integrado a 1?

8

Eu tenho tentado encontrar o valor esperado de uma função de uma variável aleatória com uma distribuição de Dirichlet, integrando seu produto à função de densidade de Dirichlet sobre um simplex em R.

Para verificar se eu estava aplicando a função correta em R, tentei integrar a função de densidade em todo o simplex, esperando obter 1, no entanto, continuei obtendo que a função de densidade para uma distribuição Dirichlet com n categorias integradas ao sqrt (n) (usando Pacote R SimplicialCubature).

Eu assumi que isso deve estar errado, mas então eu olhei para a função de densidade para 2 categorias, considere o caso em que os alfas = (1,1). Em seguida, a função de densidade é uniformemente 1 (usando a função de densidade em https://en.wikipedia.org/wiki/Dirichlet_distribution ). Portanto, a integral da função de densidade sobre o 1-simplex fornece apenas o comprimento do 1-simplex. Mas isso é sqrt (2), como descobri com o código R.

O que estou perdendo aqui?

EBartrum
fonte

Respostas:

12

Com duas variáveis, você está definindo um segmento de linha em , como você apontou. No entanto, devido à restrição simplex, uma dessas duas variáveis ​​é redundante em termos de especificação da densidade, pois existe uma relação de um para um entre x 1 e x 2 . Portanto, a densidade é especificada sobre variáveis ​​livres K - 1 (ou seja, em R )R2x1x2K1R

Isso é realmente apontado na primeira linha desta seção do artigo da Wikipedia, embora muito sutilmente.

Portanto, sua função de densidade se torna :.

Dir1,1(x1,1x1)=Γ(2)Γ(1)2(x1)0(1x1)0=1

Portanto,

01Dir1,1(x1,1x1)dx1=1

Resposta ao comentário do OP

Devido aos constrangimentos simplex, o de duas variáveis Dirichlet densidade é, na verdade, degenerado em , como mostrado pela minha construção acima (que requer apenas uma variável). Embora seja verdade que tenha uma densidade de 1 , ela não tem uma densidade de 1 no segmento de linha que conecta ( 1 , 0 ) a ( 0 , 1 ) . O que a construção acima mostra é que a densidade marginal tem um valor de 1 . Sua confusão vem de pensar em x 2 como uma variável livre; nesse caso, o apoio do Dirichlet emR211(1,0)(0,1)1x2 teria uma área diferente de zero. Essa intuição é boa em casos como o gaussiano bivariado, onde as duas variáveis ​​não estão perfeitamente correlacionadas, mas não neste caso.R2

Podemos derivar formalmente da seguinte maneira:

Seja um número em [ 0 , L[0,2](1,0)(0,1)L(x1,x2)1

P(L[a,b])=ba

x1,x2

PL(L[a,b])=PX1,X2[(x1,x2)A[a,b]]

A[a,b]:={(u,v):u[1b2,1a2],v=1u]

PL(L[a,b])

PL(L[a,b])=A[a,b]dPX1,X2=A[a,b]dPX1dPX2|X1=A[a,b]1dPX1=1b21a21du=

(1a2)(1b2)=12(ba)

dPX2|X1=1X2=1X11X1

12R212


fonte
1
Muito obrigado, eu concordo com a lógica do que você escreveu, mas não posso enquadrar isso em minha mente com o fato de que a função tem valor constante 1 e a linha tem comprimento sqrt (2). Então, por que a integral não deveria dar sqrt (2) ??
EBartrum 14/10
@EBartrum vou acrescentar alguns esclarecimentos 7:30 EDT
3
@EBartrum acrescentou mais alguns detalhes para completar o post (eu sei que você já aceitou, mas outros podem querer os detalhes extra)