Variação do produto das variáveis ​​dependentes

32

Qual é a fórmula para variação do produto de variáveis ​​dependentes?

No caso de variáveis ​​independentes, a fórmula é simples:

var(XY)=E(X2Y2)E(XY)2=var(X)var(Y)+var(X)E(Y)2+var(Y)E(X)2
Mas qual é a fórmula para variáveis ​​correlacionadas?

A propósito, como posso encontrar a correlação com base nos dados estatísticos?

Riga
fonte

Respostas:

32

Bem, usando a identidade familiar que você apontou,

var(XY)=E(X2Y2)E(XY)2

Usando a fórmula análoga para covariância,

E(X2Y2)=cov(X2,Y2)+E(X2)E(Y2)

e

E(XY)2=[cov(X,Y)+E(X)E(Y)]2

o que implica que, em geral, pode ser escrito comovar(XY)

cov(X2,Y2)+[var(X)+E(X)2][var(Y)+E(Y)2][cov(X,Y)+E(X)E(Y)]2

Observe que, no caso de independência, e isso reduz acov(X2,Y2)=cov(X,Y)=0

[var(X)+E(X)2][var(Y)+E(Y)2][E(X)E(Y)]2

e os dois termos são cancelados e você obtém[E(X)E(Y)]2

var(X)var(Y)+var(X)E(Y)2+var(Y)E(X)2

como você apontou acima.

Editar: se tudo o que você observa é e não e separadamente, não creio que haja uma maneira de você estimar ou exceto em casos especiais (por exemplo, se tiverem meios conhecidos a priori )X Y c o v ( X , Y ) c o v ( X 2 , Y 2 ) X , YXYXYcov(X,Y)cov(X2,Y2)X,Y

Macro
fonte
2
por que você coloca [var (X) + E (X) 2] ⋅ [var (Y) + E (Y) 2] em vez de E (X2) E (Y2) ???
1
@ user35458, para que ele possa acabar com a equação como uma expressão de var (X) e var (Y), portanto comparável à instrução do OP. Observe que E (X ^ 2) = Var (X) + E (X) ^ 2 #
Waldir Leoncio
2
Para responder (offline) a um desafio agora excluído da validade dessa resposta, comparei seus resultados ao cálculo direto da variação do produto em muitas simulações. Não é uma fórmula prática a ser usada se você puder evitá-la, pois pode perder precisão substancial através do cancelamento ao subtrair um termo grande de outro - mas esse não é o ponto. Uma armadilha a ter em atenção é que esta questão diz respeito a variáveis ​​aleatórias. Seus resultados se aplicam aos dados, desde que você calcule variações e covariâncias usando denominadores de vez den - 1nn1 (como é habitual no software).
whuber
14

Este é um adendo à ótima resposta do @ Macro, que estabelece exatamente o que é necessário saber para determinar a variação do produto de duas variáveis ​​aleatórias correlacionadas. Como onde , , , e cov(X,Y)E[X]E[Y]E[X2]E

(1)var(XY)=E[(XY)2](E[XY])2=E[(XY)2](cov(X,Y)+E[X]E[Y])2(2)=E[X2Y2](cov(X,Y)+E[X]E[Y])2(3)=(cov(X2,Y2)+E[X2]E[Y2])(cov(X,Y)+E[X]E[Y])2
cov(X,Y)E[X]E[Y]E[X2]E [ X 2 Y 2 ] ( 2 ) cov ( X 2 , Y 2 ) ( 3 ) X Y cov ( X , Y ) = cov ( X 2 , Y 2 ) = 0 cov ( X , Y ) 0 E [ X 2 Y 2 ] cov (E[Y2] Como se pode presumir que são quantidades conhecidas, precisamos determinar o valor de em ou em . Isso não é fácil de fazer em geral, mas, como já apontado, se e são variáveis ​​aleatórias independentes , . De fato, dependência, não correlação (ou falta dela) é a questão principal. O fato de sabermos que é igual a vez de algum valor diferente de zero, por si só,E[X2Y2](2)cov(X2,Y2)(3)XYcov(X,Y)=cov(X2,Y2)=0cov(X,Y)0ajuda no mínimo em nossos esforços estão determinando o valor de ou mesmo que não simplificar os lados direito e um pouco.E[X2Y2]( 2 ) ( 3 )cov(X2,Y2)(2)(3)

Quando e são variáveis ​​aleatórias dependentes , em pelo menos um caso especial (bastante comum ou bastante importante), é possível encontrar o valor de relativa facilidade.Y E [ X 2 Y 2 ]XYE[X2Y2]

Suponha que e sejam variáveis ​​aleatórias conjuntamente normais com coeficiente de correlação . Então, condicionada em , a densidade condicional de é uma densidade normal com média e variação . Assim, Y ρ X = x Y E [ Y ] + ρ XYρX=xYvar(Y)(1-ρ2)E[X2Y2X]E[Y]+ρvar(Y)var(X)(xE[X])var(Y)(1ρ2)Xg(X)E[X2Y2]=E[E[X2Y2|X]]=E[g(X)](4)X

E[X2Y2X]=X2E[Y2X]=X2[var(Y)(1ρ2)+(E[Y]+ρvar(Y)var(X)(XE[X]))2]
que é uma função quártica de , digamos , e a Lei da Expectativa Iterada nos diz que onde o lado direito de pode ser calculado a partir do conhecimento do 3º e 4º momentos do - resultados padrão que podem ser encontrados em muitos textos e livros de referência (significando que tenho preguiça de procurá-los e incluí-los nesta resposta).Xg(X)
(4)E[X2Y2]=E[E[X2Y2X]]=E[g(X)]
(4)X

Adendo adicional: em uma resposta agora excluída, o @Hydrologist fornece a variação de como e afirma que esta fórmula é de dois artigos publicados há meio século na JASA. Esta fórmula é uma transcrição incorreta dos resultados nos artigos citados por Hydrologist. Especificamente,XY

(5)Var[xy]=(E[x])2Var[y]+(E[y])2Var[x]+2E[x]Cov[x,y2]+2E[y]Cov[x2,y]+2E[x]E[y]Cov[x,y]+Cov[x2,y2](Cov[x,y])2
Cov[x2,y2]é uma tradução incorreta de no artigo da revista e da mesma forma para e .C o v [ x 2 , y ] C o v [ x , y 2 ]E[(xE[x])2(yE[y])2]Cov[x2,y]Cov[x,y2]
Dilip Sarwate
fonte
Para o cálculo de no caso normal conjunto, consulte também math.stackexchange.com/questions/668641/…E(X2Y2)
Samuel Reid