Qual é o valor esperado da distribuição Dirichlet modificada? (problema de integração)

14

É fácil produzir uma variável aleatória com distribuição Dirichlet usando variáveis ​​Gamma com o mesmo parâmetro de escala. E se:

XiGamma(αi,β)

Então:

(X1jXj,,XnjXj)Dirichlet(α1,,αn)

Problema O que acontece se os parâmetros da escala não forem iguais?

XEuGama(αEu,βEu)

Então, qual é a distribuição dessa variável?

(X1jXj,,XnjXj)?

Para mim, seria suficiente saber o valor esperado dessa distribuição.
Preciso de uma fórmula algébrica fechada aproximada que possa ser avaliada muito rapidamente por um computador.
Digamos que a aproximação com precisão de 0,01 seja suficiente.
Você pode assumir que:

αi,βiN

Nota Em resumo, a tarefa é encontrar uma aproximação dessa integral:

f(α,β)=R+nx1jxjjβjαjΓ(αj)xjαj1eβjxjdx1dxn

Łukasz Lew
fonte
1
@ Łukasz Você pode dizer mais alguma coisa sobre os parâmetros , e ? É possível obter expressões exatas para e, assim, aproximar as expectativas das proporções, mas, para certas combinações de parâmetros, é possível explorar aproximações Normal ou de ponto de sela com menos trabalho. Eu não acho que haverá um método de aproximação universal, razão pela qual restrições adicionais seriam bem-vindas. nαiβijXj
whuber
ej X j estão correlacionados, portanto temos que aproximar a própria integral. α i é geralmente um número pequeno como 1 ou 2 e às vezes é tão grande quanto 10000. Da mesma forma, w β i, mas geralmente é 10 vezes maior que α i . X1jXjαiβiαi
Łukasz Lew
O problema é com pequenas . Se todos os α i forem grandes, a boa aproximação de toda a integral é: α 1 / β 1αiαiα1/β1jαj/βj
Łukasz Lew
@ Asukasz Se você precisa avaliar a expressão da expectativa, por que precisa de uma fórmula algébrica? Estou pensando em aplicar algum truque numérica para obter a expectativa, mas eu preciso de algum feedback :)
deps_stats
Preciso avaliar isso muitas vezes no meu programa. Tem que ser muito rápido, ou seja, sem loops e, de preferência, sem muitas divisões.
Łukasz Lew

Respostas:

2

Apenas uma observação inicial, se você deseja velocidade computacional, geralmente precisa sacrificar a precisão. "Mais precisão" = "Mais tempo" em geral. De qualquer forma, aqui está uma aproximação de segunda ordem, que deve melhorar a aproximação "bruta" que você sugeriu no seu comentário acima:

=α j

E(XjiXi)E[Xj]E[iXi]cov[iXi,Xj]E[iXi]2+E[Xj]E[iXi]3Var[iXi]
=αjiβjβiαi×[11(iβjβiαi)+1(iαiβi)2(iαiβi2)]

EDIT Foi solicitada uma explicação para a expansão acima. A resposta curta é a Wikipedia . A resposta longa é dada abaixo.

escreva . Agora precisamos de todos os derivados de "segunda ordem" def. Os derivativos de primeira ordem serão "cancelados" porque todos envolverão múltiplosX-E(X)eY-E(Y)que são zero quando se toma as expectativas.f(x,y)=xyfXE(X)YE(Y)

2f

2fx2=0
2f
2fxy=1y2
2fy2=2xy3

E assim a série de taylor até a segunda ordem é dada por:

xyμxμy+12(1μy22(xμx)(yμy)+2μxμy3(yμy)2)

Atender às expectativas gera:

E[xy]μxμy1μy2E[(xμx)(yμy)]+μxμy3E[(yμy)2]

Qual é a resposta que eu dei. (embora eu tenha esquecido inicialmente o sinal de menos no segundo período)

probabilityislogic
fonte
Parece exatamente o que eu preciso. Você pode explicar como conseguiu essa expansão? Tentei em uma série de maneiras e foi incapaz de fazer isso ...
Łukasz Lew