Construção da distribuição Dirichlet com distribuição Gamma

17

Seja X1,,Xk+1 variáveis ​​aleatórias mutuamente independentes, cada uma com uma distribuição gama com os parâmetros αi,i=1,2,,k+1 mostre que Yi=XiX1++Xk+1,i=1,,k, tem uma distribuição conjunta comoDirichlet(α1,α2,,αk;αk+1)

PDF conjunto de (X1,,Xk+1)=ei=1k+1xix1α11xk+1αk+11Γ(α1)Γ(α2)Γ(αk+1) Então, para encontrar pdf conjunto de(Y1,,Yk+1)não consigo encontrar jacobiano, ou seja,J(x1,,xk+1y1,,yk+1)

Argha
fonte
3
Dê uma olhada nas páginas 13-14 deste documento .
@ Procrastinator Muito obrigado, seu documento é a melhor resposta para minha pergunta.
Argha
2
@ Procrastinator - talvez você deva colocar isso como resposta, já que o OP está satisfeito com isso e adicionar algumas frases para não disparar o aviso "queremos mais que uma frase"?
jbowman
4
Esse documento agora é uma não resposta, porque é um 404.
whuber
2
Wayback machine to the rescue: pdf
mobeets

Respostas:

29

Os jacobianos - os determinantes absolutos da mudança de função variável - parecem formidáveis ​​e podem ser complicados. No entanto, eles são uma parte essencial e inevitável do cálculo de uma mudança multivariada de variável. Parece que não há nada a fazer além de escrever uma matriz de derivadas k+1 por k+1 e fazer o cálculo.

Existe uma maneira melhor. É mostrado no final da seção "Solução". Como o objetivo deste post é apresentar aos estatísticos o que pode ser um novo método para muitos, grande parte dele é dedicado à explicação do mecanismo por trás da solução. Esta é a álgebra de formas diferenciais . (Formas diferenciais são as coisas que se integram em várias dimensões.) Um exemplo detalhado e trabalhado é incluído para ajudar a tornar isso mais familiar.


fundo

Há mais de um século, os matemáticos desenvolveram a teoria da álgebra diferencial para trabalhar com as "derivadas de ordem superior" que ocorrem na geometria multidimensional. O determinante é um caso especial dos objetos básicos manipulados por essas álgebras, que normalmente são formas multilineares alternadas . A beleza disso reside em quão simples os cálculos podem se tornar.

Aqui está tudo o que você precisa saber.

  1. Um diferencial é uma expressão da forma " dxi ". É a concatenação de " d " com qualquer nome de variável.

  2. Uma forma única é uma combinação linear de diferenciais, como dx1+dx2 ou mesmo . Ou seja, os coeficientes são funções das variáveis.x2dx1exp(x2)dx2

  3. Os formulários podem ser "multiplicados" usando um produto de cunha , escrito . Este produto é anti-comutativo (também chamado de alternância ): para quaisquer duas formas únicas ω e η ,ωη

    ωη=ηω.

    Essa multiplicação é linear e associativa: em outras palavras, funciona da maneira familiar. Uma conseqüência imediata é que , implicando que o quadrado de qualquer forma única é sempre zero. Isso torna a multiplicação extremamente fácil!ωω=ωω

  4. Para fins de manipulação dos integrandos que aparecem nos cálculos de probabilidade, uma expressão como pode ser entendida como | ddx1dx2dxk+1.|dx1dx2dxk+1|

  5. Quando é uma função, então seu diferencial é dado por diferenciação:y=g(x1,,xn)

    dy=dg(x1,,xn)=gx1(x1,,xn)dx1++gx1(x1,,xn)dxn.

A conexão com os jacobianos é a seguinte: o jacobiano de uma transformação é, até o momento, simplesmente o coeficiente de d x(y1,,yn)=F(x1,,xn)=(f1(x1,,xn),,fn(x1,,xn)) que aparece na computaçãodx1dxn

dy1dyn=df1(x1,,xn)dfn(x1,,xn)

depois de expandir cada um dos como uma combinação linear dos d x j na regra (5).dfidxj


Exemplo

A simplicidade dessa definição de jacobiana é atraente. Ainda não está convencido de que vale a pena? Considere o conhecido problema de converter integrais bidimensionais de coordenadas cartesianas em coordenadas polares ( r , θ ) , onde ( x , y ) = ( r cos(x,y)(r,θ) . A seguir, é uma aplicação totalmente mecânica das regras anteriores, onde " ( )(x,y)=(rcos(θ),rsin(θ))()"é usado para abreviar expressões que obviamente desaparecerão em virtude da regra (3), que implica em .drdr=dθdθ=0

dxdy=|dxdy|=|d(rcos(θ))d(rsin(θ))|=|(cos(θ)drrsin(θ)dθ)(sin(θ)dr+rcos(θ)dθ|=|()drdr+()dθdθrsin(θ)dθsin(θ)dr+cos(θ)drrcos(θ)dθ|=|0+0+rsin2(θ)drdθ+rcos2(θ)drdθ|=|r(sin2(θ)+cos2(θ))drdθ)|=r drdθ.

O ponto disso é a facilidade com que esses cálculos podem ser executados, sem mexer com matrizes, determinantes ou outros objetos multi-indiciais. Você apenas multiplica as coisas, lembrando que as fatias são anti-comutativas. É mais fácil do que o que é ensinado na álgebra do ensino médio.


Preliminares

Vamos ver essa álgebra diferencial em ação. Em este problema, o PDF da distribuição conjunta de é o produto dos PDF individuais (porque o X i são assumidos como sendo independente). Para lidar com a mudança nas variáveis Y i , devemos ser explícitos sobre os elementos diferenciais que serão integrados. Estes formam o termo d x 1 d x 2d x k + 1(X1,X2,,Xk+1)XiYidx1dx2dxk+1. Including the PDF gives the probability element

fX(x,α)dx1dxk+1(x1α11exp(x1))(xk+1αk+11exp(xk+1))dx1dxk+1=x1α11xk+1αk+11exp((x1++xk+1))dx1dxk+1.

(The normalizing constant has been ignored; it will be recovered at the end.)

Staring at the definitions of the Yi a few seconds ought to reveal the utility of introducing the new variable

Z=X1+X2++Xk+1,

giving the relationships

Xi=YiZ.

This suggests making the change of variables xiyiz in the probability element. The intention is to retain the first k variables y1,,yk along with z and then integrate out z. To do so, we have to re-express all the dxi in terms of the new variables. This is the heart of the problem. It's where the differential algebra takes place. To begin with,

dxi=d(yiz)=yidz+zdyi.

Note that since Y1+Y2++Yk+1=1, then

0=d(1)=d(y1+y2++yk+1)=dy1+dy2++dyk+1.

Consider the one-form

ω=dx1++dxk=z(dy1++dyk)+(y1++yk)dz.

It appears in the differential of the last variable:

dxk+1=zdyk+1+yk+1dz=z(dy1++dyk)+(1y1yk)dz=dzω.

The value of this lies in the observation that

dx1dxkω=0

because, when you expand this product, there is one term containing dx1dx1=0 as a factor, another containing dx2dx2=0, and so on: they all disappear. Consequently,

dx1dxkdxk+1=dx1dxkzdx1dxkω=dx1dxkz.

Whence (because all products dzdz disappear),

dx1dxk+1=(zdy1+y1dz)(zdyk+ykdz)dz=zkdy1dykdz.

The Jacobian is simply |zk|=zk, the coefficient of the differential product on the right hand side.


Solution

The transformation (x1,,xk,xk+1)(y1,,yk,z) is one-to-one: its inverse is given by xi=yiz for 1ik and xk+1=z(1y1yk). Therefore we don't have to fuss any more about the new probability element; it simply is

(zy1)α11(zyk)αk1(z(1y1yk))αk+11exp(z)|zkdy1dykdz|=(zα1++αk+11exp(z)dz)(y1α11ykαk1(1y1yk)αk+11dy1dyk).

That is manifestly a product of a Gamma(α1++αk+1) distribution (for Z) and a Dirichlet(α) distribution (for (Y1,,Yk)). In fact, since the original normalizing constant must have been a product of Γ(αi), we deduce immediately that the new normalizing constant must be divided by Γ(α1++αk+1), enabling the PDF to be written

fY(y,α)=Γ(α1++αk+1)Γ(α1)Γ(αk+1)(y1α11ykαk1(1y1yk)αk+11).
whuber
fonte