Explicação intuitiva da contribuição para a soma de duas variáveis ​​aleatórias normalmente distribuídas

16

Se eu tenho duas variáveis ​​aleatórias independentes e normalmente distribuídas com médias e e desvios padrão e e descubro que , então (assumindo que não cometi nenhum erro) a distribuição condicional de e dado também são normalmente distribuídos com meios e desvio padrão Y μ X μ Y σ X σ Y X + Y = c X Y c μ X | c = μ X + ( c - μ X - μ Y ) σ 2 XXYμXμYσXσYX+Y=cXYc μY| c=μY+(c-μX-μY)σ 2 Y

μX|c=μX+(c-μX-μY)σX2σX2+σY2
μY|c=μY+(c-μX-μY)σY2σX2+σY2
σX|c=σY|c=σX2σY2σX2+σY2.

Não é de surpreender que os desvios padrão condicionais sejam os mesmos que, dado , se um sobe, o outro deve descer na mesma quantidade. É interessante que o desvio padrão condicional não dependa de c .cc

O que não consigo entender são os meios condicionais, nos quais eles compartilham o excesso (c-μX-μY) proporcional às variações originais, não aos desvios padrão originais.

Por exemplo, se elas tiverem médias zero, μX=μY=0 0 e desvios padrão σX=3 e σY=1 , condicionados em c=4 , teríamos E[X|c=4]=3.6. e E[Y|c=4]=0,4 , ou seja, na proporção 9:1 , embora eu pensasse intuitivamente que a proporção 3:1 seria mais natural. Alguém pode dar uma explicação intuitiva para isso?

Isso foi provocado por uma pergunta Math.SE

Henry
fonte

Respostas:

16

A questão se reduz rapidamente ao caso observando e .μX=μY=0 0X-μXY-μY

Claramente, as distribuições condicionais são normais. Assim, a média, mediana e modo de cada um são coincidentes. Os modos ocorrerão nas coordenadas de um máximo local do PDF bivariado de e restrito à curva . Isso implica o contorno do PDF bivariado nesse local e a curva de restrição tem tangentes paralelas. (Esta é a teoria dos multiplicadores de Lagrange.) Como a equação de qualquer contorno é da forma para alguma constante (ou seja, todos os contornos são elipses), seus gradientes devem ser paralelos, de onde exista modo queXYg(x,y)=x+y=cf(x,y)=x2/(2σX2)+y2/(2σY2)=ρρλ

(xσX2,yσY2)=f(x,y)=λg(x,y)=λ(1,1).

insira a descrição da imagem aqui

Segue-se imediatamente que os modos das distribuições condicionais (e, portanto, também as médias) são determinados pela razão das variações, não dos DPs.

Essa análise também funciona para e correlacionados e se aplica a quaisquer restrições lineares, não apenas à soma.XY

whuber
fonte
Isso é muito impressionante e bastante mais completo do que eu estava pedindo. Eu ficaria satisfeito com o diagrama e uma afirmação de que a tangente à elipse não passa pelo centro da elipse, de modo que o ponto vermelho da tangente deve levar desproporcionalmente mais da variável aleatória com um desvio padrão mais alto.
Henry
1
Isso não foi bem formulado. O que eu quis dizer foi que a linha do centro até o ponto vermelho não é perpendicular à tangente.
Henry