Distribuição do máximo de duas variáveis ​​normais correlacionadas

Respostas:

22

De acordo com Nadarajah e Kotz, 2008 , Distribuição exata das máximas / mínimas de duas variáveis ​​aleatórias gaussianas , o PDF de X=max(X1,X2) parece ser

f(x)=2ϕ(x)Φ(1-r1-r2x),

onde ϕ é o PDF e Φ é o CDF da distribuição normal padrão.

insira a descrição da imagem aqui

Lucas
fonte
Como é isso se (sem correlação)? Estou tendo problemas para visualizá-lo. r=0 0
Mitch
3
Eu adicionei uma figura visualizando a distribuição. Parece um gaussiano espremido ligeiramente inclinado para a direita.
Lucas
22

Seja o PDF normal bivariado para com marginais padrão e correlação . O CDF do máximo é, por definição, ( X , Y ) ρfρ(X,Y)ρ

Pr(max(X,Y)z)=Pr(Xz, Yz)=-z-zfρ(x,y)dydx.

O PDF normal bivariado é simétrico (via reflexão) em torno da diagonal. Assim, aumentar a adiciona duas tiras de probabilidade equivalente ao quadrado semi-infinito original: o superior infinitesimalmente grosso é enquanto sua contrapartida refletida, o faixa direita, é .z + d z ( - , z ] × ( z , z + d z ]zz+dz(-,z]×(z,z+dz](z,z+dz]×(-,z]

Figura

A densidade de probabilidade da faixa da direita é a densidade de em vezes a probabilidade condicional total de que esteja na faixa, . A distribuição condicional de é sempre Normal, portanto, para encontrar essa probabilidade condicional total, precisamos apenas da média e variância. A média condicional de em é a previsão de regressão e a variação condicional é a variação "inexplicável" .z Y Pr ( Y zXzYY Y X ρ XPr(Yz|X=z)YYXρXvar(Y)-var(ρX)=1-ρ2

Agora que sabemos a média e a variância condicionais, o CDF condicional de dado pode ser obtido padronizando e aplicando o CDF normal :X Y ΦYXYΦ

Pr(Yy|X)=Φ(y-ρX1-ρ2).

Avaliando esta em e e multiplicando pela densidade de em (um padrão de pdf normal ) dá a densidade de probabilidade do segundo (do lado direito) tiray=zX z ϕX=zXzϕ

ϕ(z)Φ(z-ρz1-ρ2)=ϕ(z)Φ(1-ρ1-ρ2z).

Dobrar isso explica a faixa superior equivalente, fornecendo o PDF do máximo como

ddzPr(max(X,Y)z)=2ϕ(z)Φ(1-ρ1-ρ2z).

Recapitulação

Eu pintei os fatores para significar suas origens: para as duas tiras simétricas; para as larguras infinitesimais da faixa; e para os comprimentos das tiras. O argumento deste último, , é apenas uma versão padronizada de condicional a .ϕ ( z ) Φ ( ) 1 - ρ2ϕ(z)Φ()Y=zX=z1-ρ1-ρ2zY=zX=z

whuber
fonte
Isso pode ser estendido para mais de duas variáveis ​​normais padrão com determinada matriz de correlação?
A. Donda
1
@ A.Donda Sim - mas a expressão fica mais complicada. A cada nova dimensão, surge a necessidade de integrar mais uma vez.
whuber