Gerando variáveis ​​aleatórias binomiais com determinada correlação

8

Suponha que eu saiba gerar variáveis ​​aleatórias binomiais independentes. Como posso gerar duas variáveis ​​aleatórias e modo que X \ sim \ text {Bin} (8, \ dfrac {2} {3}), \ quad Y \ sim \ text {Bin} (18, \ dfrac {2 } {3}) \ \ text {e} \ \ text {Corr} (X, Y) = 0,5XY

XBin(8,23),YBin(18,23)  and  Corr(X,Y)=0.5

Pensei em tentar usar o fato de que X e YρX são independentes em que ρ=Corr(X,Y) mas não acho que XρY seja distribuído binomialmente, portanto não posso usar esse método. Se isso funcionasse, eu teria gerado duas variáveis ​​aleatórias binomiais, digamos A e B , então defina X=A e YρX=B ou seja, Y=B+ρA e, portanto, eu teria o par (X,Y) . Mas não posso fazer isso, pois YρX não é binomialmente distribuído.

Qualquer dica será apreciada sobre como proceder.

Landon Carter
fonte
Na verdade, esse problema surgiu em um exame do semestre, então não é lição de casa, mas você pode chamá-lo de auto-estudo, eu acho. Adicionada a tag.
Landon Carter

Respostas:

8

Você não pode usar a representação linear da correlação em distribuições de suporte discretas.

No caso especial da distribuição binomial, a representação pode ser explorado, pois Se escolhermos que alguns dos sejam iguais a alguns dos 's e gerados independentemente, obteremos que a notação indica que é escolhido idêntico a vez de gerado como um Bernoulli

X=i=18δiY=i=118γiδi,γiB(1,2/3)
cov(X,Y)=i=18j=118cov(δi,γj)
δiγj
cov(X,Y)=i=18j=118I(δi:=γj)var(γj)
I(δi:=γj)δiγjB(1,2/3) .

Como a restrição é , temos que resolver Isso significa que se escolhermos 6 dos 8 igual a 6 dos 18 , devemos obter essa correlação de 0,5.

cov(X,Y)=0.5×8×18×23×13
i=18j=118I(δi:=γj)=0.5×8×18=6
δiγj

A implementação é a seguinte:

  1. Gere , , ;ZB(6,2/3)Y1B(12,2/3)X1B(2,2/3)
  2. Toma eX=Z+Z1Y=Z+Y1

Podemos verificar este resultado com uma simulação R

> z=rbinom(10^8,6,.66)
> y=z+rbinom(10^8,12,.66)
> x=z+rbinom(10^8,2,.66)
cor(x,y)
> cor(x,y)
[1] 0.5000539

Comente

Esta é uma solução bastante artificial para o problema, pois funciona apenas porque é um quadrado perfeito e porque é um número inteiro. Para outras correlações aceitáveis, a randomização seria necessária, ou seja, seria zero ou um com alguma probabilidade .8×18cor(X,Y)×8×18I(δi:=γj)ϱ

Termo aditivo

O problema foi proposto e resolvido anos atrás no Stack Overflow com a mesma idéia de compartilhar Bernoullis.

Xi'an
fonte
1
+1. Você não precisa que seja um quadrado. As condições para Cor ter uma solução (através deste método) para Binômio e Binomial são (1) e ( 2) é um número inteiro. Para certos negativo , usando uma distribuição Multinomial dá uma solução. Uma abordagem mais geral - mas mais difícil - usaria cópulas. 8×18(X,Y)=ρX(n,p)Y(m,q)p=q0ρmnmin(m,n)ρ
whuber
@ whuber: pela correlação negativa, primeiro pensei em usar mas obviamente não funciona. Você poderia expandir a solução genérica? (Eu também pensei de cópulas, mas calibrar cópulas para chegar a correlação direito é um negócio desagradável, não é ?!1γj
Xi'an
Xian, eu gostaria de perguntar se o método que você usou é padrão. Isso porque pesquisei bastante na internet e não consegui encontrar nada.
Landon Carter
2
Eu concordo com você - não quero trabalhar com essas cópulas! Mas pelo menos, mostrar que as soluções deve existir (dentro de certos limites sobre , dependentes de outros parâmetros) na configuração mais geral. Seria interessante descobrir se construções mais simples, como a que você descreve aqui, poderiam ser usadas para lidar com casos em que ou . Yedaynara: o método de dividir duas variáveis em é padrão para qualquer família paramétrica fechada por adição; e é tudo o que está acontecendo aqui. ρpqρ<0X,YX+Z,Y+Z
whuber
@yedaynara: Estou surpreso que você não tenha encontrado "nada", pois pesquisei no Google "simulação binomial correlacionada" e encontrei imediatamente este post no Stack Overflow .
Xi'an