Covariância para três variáveis

8

Estou tentando entender como a matriz de covariância funciona. Então, vamos supor que temos duas variáveis: , onde fornece a relação entre as variáveis, ou seja, quanto uma depende da outra.Cov ( X , Y ) = E [ ( x - E [ X ] ) ( y - E [ Y ] ) ]X,YCov(X,Y)=E[(x-E[X])(y-E[Y])]

Agora, três casos variáveis, é menos claro para mim. Uma definição intuitiva para a função de covariância seria , mas a literatura sugere o uso da matriz de covariância que é definida como covariância de duas variáveis ​​para cada par de variáveis.Cov(X,Y,Z)=E[(x-E[X])(y-E[Y])(z-E[Z])]

Então, a covariância inclui informações completas sobre relações variáveis? Em caso afirmativo, qual é a relação com a minha definição de ?Cov(X,Y,Z)

Karolis
fonte
1
Penso que vejo que a minha definição simplesmente não funciona. Mas a matriz de covariância é suficiente para quantificar a relação entre todas as variáveis?
Karolis
5
A matriz de covariância é suficiente para quantificar a covariância entre todas as variáveis, mas não as "relações", pois trata-se de um conceito geral (as variáveis ​​podem ser relacionadas ou dependentes de várias maneiras não lineares diferentes que não são capturadas pela covariância). Uma exceção a isso seria se você conhecesse as variáveis ​​em que a variável multi-normal era normal.
Zachary Blumenfeld
Obrigado @ZacharyBlumenfeld! Você poderia recomendar um bom livro sobre isso?
Karolis
2
Qual é a diferença entre e X no termo x - E [ X ] ? Eu sei o que você quer dizer com X - é uma variável aleatória - e também com E [ X ] - é o valor esperado de X , um número real - mas o que é x ? Se x é outro número real, então x - E [ X ] é um número real - nada de aleatório - e sua definição se reduz a cov ( X , Y , Z )xXx-E[X]XE[X]Xxxx-E[X] porque o valor esperado de um número real é o próprio número real.
cov(X,Y,Z)=E[(x-E[X])(y-E[Y])(z-E[Z])]=(x-E[X])(y-E[Y])(z-E[Z])
Dilip Sarwate
2
@ZacharyBlumenfeld, seu comentário quase se qualifica como resposta. Talvez você deva expandir um pouco (acrescente que é um momento central de terceira ordem, o que mais? e postar como resposta? E[(x-E[X])(y-E[Y])(z-E[Z])]
Richard Hardy

Respostas:

1

Para expandir o comentário de Zachary, a matriz de covariância não captura a "relação" entre duas variáveis ​​aleatórias, pois "relação" é um conceito muito amplo. Por exemplo, provavelmente gostaríamos de incluir a dependência de duas variáveis ​​entre si para incluir em qualquer medida de sua "relação". Entretanto, sabemos que cov(X,Y)=0 0 não implica que sejam independentes, como por exemplo, o caso de duas variáveis ​​aleatórias X ~ U (-1,1) e Y = X ^ 2 (para uma prova curta, consulte: https://en.wikipedia.org/wiki/Covariance#Uncorrelatedness_and_independence ).

Portanto, se pensarmos que a covariância inclui informações completas sobre relações variáveis, como você pergunta, covariância zero não sugere dependência. É isso que Zachary quer dizer quando diz que pode haver dependências não lineares que a covariância não captura.

No entanto, deixar que X: =(X1,...,Xn) ser normal multivariada, X ~ N(μ,Σ) . Em seguida, X1,...,Xn são independentes sse Σ é uma matriz diagonal com todos os elementos fora da diagonal = 0 (se todas as covariâncias = 0).

Para ver que esta condição é suficiente, observa-se que a densidade factores comuns,

f(x1,...,xn)=1(2π)n|Σ|exp(-12(x-μ)Σ-1(x-μ))=ΠEu=1n12πσEuEuexp(-(xEu-μEu)22σEuEu)=f1(x1)...fn(xn)
.

X1X2X1X1|X2=x2

σ11=σ11|2=σ11-σ122σ22-1

σ12=0 0Σ

(fonte: slides avançados de Econometria do professor Geert Dhaene)

hrrrrrr5602
fonte