condicional ao total, qual é a distribuição dos binômios negativos

9

Se são binomiais negativos, então qual é a distribuição de ( x 1 , x 2 , , x n ) dadax1,x2,,xn(x1,x2,,xn)

x1+x2++xn=N?

é fixo.N

Se são Poisson, então, condicional ao total, ( x 1 , x 2 , , x n ) é multinomial. Não tenho certeza se isso é verdade para o binômio negativo, pois é uma mistura de Poisson.x1,x2,,xn(x1,x2,,xn)

Caso você queira saber, isso não é um problema de lição de casa.

qkhhly
fonte
2
Dada a conexão entre as distribuições Gamma e o Dirichlet, meu primeiro palpite seria que - pelo menos, devido às restrições apropriadas aos binômios Negativos -, em alguns casos, pode ser multinacional de Dirichlet.
Glen_b -Reinstate Monica
Pesquisando nos termos do seu post e meu comentário produz alguns hits que sugerem que essa pode ser uma linha proveitosa a seguir.
Glen_b -Reinstala Monica

Respostas:

7

Desculpe pela resposta tardia, mas isso também me incomodou e eu encontrei a resposta. A distribuição é realmente Dirichlet-Multinomial e o indivíduo neg. as distribuições binomiais nem precisam ser idênticas, desde que o fator Fano (razão de variância / média) seja idêntico.

Resposta longa:

Se você parametrizar NB como:

p(X=x|λ,θ)=NB(x|λ,θ)=(θ1λ+x1x)(11+θ1)x(θ11+θ1)θ1λ

Então e eE(X)=λVar(X)=λ(1+θ)

i:XiNB(λi,θ) implica

XiNB(λi,θ)

Tomando a probabilidade dada a soma:

NB(xi|λi,θ)NB(xi|λi,θ)=(11+θ1)xi(θ11+θ1)θ1λi(θ1λi+xi1xi)(11+θ1)xi(θ11+θ1)θ1λi(θ1λi+xi1xi)==Γ(xi+1)Γ(θ1λi)Γ(θ1λi+xi)Γ(θ1λi+xi)Γ(xi+1)Γ(θ1λi)=DM(x1,...,xn|θ1λ1,...,θ1λn)

onde é a probabilidade Dirichlet-Multinomial. Isso resulta simplesmente do fato de que, exceto pelos coeficientes multinomiais, muitos dos termos da fração do lado esquerdo são cancelados, deixando apenas os termos da função gama que são os mesmos da probabilidade de DM.DM

Observe também que os parâmetros deste modelo não são identificáveis ​​como aumento em com diminuição simultânea de todos os resultados exatamente na mesma probabilidade.θλi

A melhor referência que tenho para isso são as seções 2 a 3.1 de Guimarães e Lindrooth (2007): Controlando a sobredispersão em modelos de logit condicionais agrupados: Uma aplicação computacionalmente simples da regressão Dirichlet-multinomial - infelizmente é paga pela parede, mas não consegui encontre uma referência não paga.

Martin Modrák
fonte