Qual é a probabilidade de dado ?

10

Suponha que X e Y sejam bivariados normais com média μ=(μ1,μ2) e covariância Σ=[σ11σ12σ12σ22] . Qual é a probabilidade Pr(X<Y|min(X,Y)) ?

Mike
fonte
@whuber certo obrigado, excluí meus pensamentos, pois eles não estão adicionando nada aqui.
AdamO 6/07/19
11
Pr(m<Y|X=m)Pr(m<Y|X=m)+Pr(m<X|Y=m)
Sextus Empiricus
link útil stats.stackexchange.com/questions/30588/… Esta é uma pergunta de auto-estudo?
Sextus Empiricus
Você deve compartilhar seus pensamentos sobre o problema, independentemente do fato de isso parecer uma pergunta de auto-estudo.
StubbornAtom

Respostas:

7

Usando a notação um pouco mais explícita , onde é um número real, não uma variável aleatória. O conjunto no qual é um caminho em forma de L com dois segmentos semi-abertos: um subindo direto do ponto e outro indo direto para a direita a partir desse mesmo ponto. É claro que na perna vertical, na perna horizontal .m min ( X , Y ) = m ( m , m ) x < y x > yP(X<Y|min(X,Y)=m)mmin(X,Y)=m(m,m)x<yx>y

mu1 = 0, mu2 = 2, sigma11 = 0,5, sigma22 = 1, sigma12 = 0,2, m = 1

Dada essa intuição geométrica, é fácil reescrever o problema de uma forma equivalente, onde no numerador temos apenas a perna vertical onde no denominador temos a soma das duas pernas.x<y

(1)P(X<Y|min(X,Y))=P(m<Y|X=m)P(m<Y|X=m)+P(m<X|Y=m)

Então agora precisamos calcular duas expressões da forma . Tais probabilidades condicionais da distribuição normal bivariada sempre têm uma distribuição normal com os parâmetros:N (P(m<X|Y=m)N(μX|Y=m,sX|Y=m2)

2)μX|Y=m=μ1 1+σ12σ22(m-μ2)

(3)sX|Y=m2=σ11-σ122σ22

Observe que na definição original do problema, refere a elementos da matriz de covariância, ao contrário da convenção mais comum de usar para o desvio padrão. Abaixo, acharemos mais conveniente usar para a variância para o desvio padrão da distribuição de probabilidade condicional. σ s 2 sσEujσs2s

Conhecendo esses dois parâmetros, podemos calcular a probabilidade de partir da função de distribuição cumulativa.m<X

4)P(m<X|Y=m)=Φ(μX;Y=m-msX;Y=m)

mutatis mutandis , temos uma expressão semelhante para . DeixeiP(Y>m|X=m)

(5)zX|Y=m=μX;Y=m-msX;Y=m

e

(6)zY|X=m=μY;X=m-msY;X=m

Em seguida, podemos escrever a solução completa de maneira compacta em termos dessas duas pontuações :z

(7)P(X<Y|min(X,Y)=m)=1 1-Φ(zX|Y=m)Φ(zX|Y=m)+Φ(zY|X=m)

Com base no código de simulação fornecido pelo autor da pergunta, podemos comparar este resultado teórico com os resultados simulados:

insira a descrição da imagem aqui

olooney
fonte
Em (3) acho que o lado esquerdo deve ter um quadrado, porque é a variação condicional enquanto o desvio padrão é usado posteriormente.
Yves
Você está certo @Yves e acredito que minhas edições recentes corrigiram o problema. Obrigado.
olooney
@olooney, obrigado por esta resposta. Eu posso seguir a derivação e parece correta. No entanto, tentei verificar (1) e (7) em uma simulação e os resultados foram bem diferentes. Você pode ver o meu código R aqui gist.github.com/mikeguggis/d041df05565f63f8be2c6c51f5cf8961
mike
@ Mike, acho que tive um erro de sinal. Depois de consertar isso, o resultado teórico parece concordar com os resultados da simulação. gist.github.com/olooney/e88a66d2d2fa7f2f0cd0d0dd6b708739
olooney
@olooney, boa captura. Ainda não consigo entender por que as duas estimativas baseadas em simulação não coincidem (linhas 30 a 32 no meu código).
mike
1

A pergunta pode ser reescrita usando uma versão modificada do teorema de Bayes (e um abuso de noção para )Pr

Pr(X<Y|mEun(X,Y)=m)=Pr(mEun(X,Y)=m|X<Y)Pr(X<Y)Pr(mEun(X,Y)=m|X<Y)Pr(X<Y)+Pr(mEun(X,Y)=m|XY)Pr(XY)=Pr(X<Y,mEun(X,Y)=m)Pr(X<Y,mEun(X,Y)=m)+Pr(XY,mEun(X,Y)=m).

Defina como o PDF bivariado de e , e . EntãofX,YXYϕ(x)=1 12πexp(-1 12x2)Φ(x)=-xϕ(t)dt

Pr(X<Y,mEun(X,Y)=m)=Pr(X=m,Y>m)=mfX,Y(m,t)dt

e

Pr(XY,mEun(X,Y)=m)=Pr(Xm,Y=m)=mfX,Y(t,m)dt

Usando normalidade e a definição de probabilidade condicional, os integrandos podem ser reescritos como

fX,Y(m,t)=fY|X(t)fX(m)=1 1σY|Xϕ(t-μY|XσY|X)1 1σ11ϕ(m-μ1 1σ11)

e

fX,Y(t,m)=fX|Y(t)fY(m)=1 1σX|Yϕ(t-μX|YσX|Y)1 1σ22ϕ(m-μ2σ22).

Onde

μX|Y=μ1 1+σ12σ22(m-μ2),

μY|X=μ2+σ12σ11(m-μ1 1),

σX|Y=(1 1-σ122σ11σ22)σ11

e

σY|X=(1 1-σ122σ11σ22)σ22.

portanto

Pr(X<Y|min(X,Y)=m)=(1Φ(mμY|XσY|X))1σ11ϕ(mμ1σ11)(1Φ(mμY|XσY|X))1σ11ϕ(mμ1σ11)+(1Φ(mμX|YσX|Y))1σ22ϕ(mμ2σ22).

Este formulário final é muito semelhante ao resultado que o @olooney chegou. A diferença é que suas probabilidades não são ponderadas pelas densidades normais.

Um script R para verificação numérica pode ser encontrado aqui

Mike
fonte