Fórmula de probabilidade para uma distribuição multivariada-bernoulli

13

Preciso de uma fórmula para a probabilidade de um evento em uma distribuição n-variável de Bernoulli com P ( X i = 1 ) = p i probabilidades para um único elemento e para pares de elementos P ( X i = 1 X j = 1 ) = p i j . Equivalentemente eu poderia dar média e covariância de X .X{0,1}nP(Xi=1)=piP(Xi=1Xj=1)=pijX

Eu já aprendi que existem muitas distribuições com as propriedades, assim como existem muitas distribuições com uma determinada média e covariância. Eu estou procurando um canônica sobre { 0 , 1 } n , assim como o Gauss é uma distribuição canônico para R n e um dado covariância média e.{0,1}n{0,1}nRn

mpiktas
fonte

Respostas:

11

A variável aleatória que recebe valores em é uma variável aleatória discreta. Sua distribuição é totalmente descrita pelas probabilidades p i = P ( X = i ) com i{ 0 , 1 } n . As probabilidades p i e p i j que você fornece são somas de p i para certos índices i .{0,1}npi=P(X=i)i{0,1}npipijpii

Agora parece que você quer descrever usando apenas p i e p i j . Não é possível sem assumir certas propriedades em p i . Para ver que tentam derivar função característica de X . Se tomarmos n = 3 , obtemospipipijpiXn=3

Não é possível reorganizar esta expressão para quep i

Eei(t1X1+t2X2+t3X3)=p000+p100eit1+p010eit2+p001eit3+p110ei(t1+t2)+p101ei(t1+t3)+p011ei(t2+t3)+p111ei(t1+t2+t3)
pidesaparecer. Para a variável aleatória gaussiana, a função característica depende apenas dos parâmetros de média e covariância. As funções características definem de forma exclusiva as distribuições, e é por isso que o Gaussiano pode ser descrito de forma única usando apenas média e covariância. Como vemos na variável aleatória esse não é o caso.X

 

mpiktas
fonte
10

Veja o seguinte documento:

JL Teugels, Algumas representações da distribuição multivariada de Bernoulli e binomial , Journal of Multivariate Analysis , vol. 32, n. 2, fevereiro de 1990, 256-268.

Aqui está o resumo:

Versões multivariadas, mas vetorizadas, para Bernoulli e distribuições binomiais são estabelecidas usando o conceito de produto Kronecker a partir do cálculo matricial. A distribuição multivariada de Bernoulli envolve um modelo parametrizado, que fornece uma alternativa ao modelo log-linear tradicional para variáveis ​​binárias.

Hamed
fonte
2
Obrigado por compartilhar isso, Hamed. Bem vindo ao nosso site!
whuber
1

Não sei como é chamada a distribuição resultante, ou se ela tem um nome, mas me parece que a maneira mais óbvia de configurar isso é pensar no modelo que você usaria para modelar 2 × 2 × 2 × … × 2 usando um modelo log-linear (regressão de Poisson). Como você conhece apenas as interações de primeira ordem, é natural supor que todas as interações de ordem superior sejam zero.

Usando a notação do questionador, isso fornece o modelo:

P(X1=x1,X2=x2,...,Xn=xn)=Eu[pEuxEu(1-pEu)1-xEuj<Eu(pEujpEupj)xEuxj]
uma parada
fonte
Esta fórmula tem problemas notacionais: existem pestá à esquerda e à direita. O lado direito não faz nenhuma referência ao subscritoEu. Além disso, ainda interpretando opEucomo probabilidades (como na pergunta original), o rhs é claramente positivo, enquanto o lhs não pode ser positivo.
whuber
@whuber Muito bem! Fico de acordo com o modelo que estabeleci no primeiro parágrafo, mas minha equação foi complicada de várias maneiras ... Mostra que não usei a modelagem log-linear de tabelas de contingência desde o meu mestrado e não o fiz. tenho as anotações ou livros em mãos. Eu acredito que eu consertei agora. Deixe-me saber se você concorda! Desculpas pelo atraso. Alguns dias meu cérebro simplesmente não faz álgebra.
onestop
1
Eu não acho que isso funciona. PresumirpEu=1/n e pij=0 0Euj. Essa é uma combinação válida de probabilidades, realizada quandoEu é uma variável aleatória uniforme {1,...,n} e XEu=1 e tudo Xj=0 0jEu. Ainda assim, a fórmula acima seria 0 para todos os eventos. Ainda obrigado por ajudar!