Covariância e independência?

54

Li no meu livro que não garante que X e Y sejam independentes. Mas se são independentes, sua covariância deve ser 0. Ainda não consegui pensar em nenhum exemplo adequado; alguém poderia fornecer um?cov(X,Y)=0

Porco voador
fonte
10
Você também pode apreciar uma rápida revisão do Quarteto de Anscombe , que ilustra algumas das muitas maneiras diferentes pelas quais uma covariância diferente de zero pode ser realizada por um conjunto de dados bivariado.
whuber
7
O ponto a ser observado é que a medida de covariância é uma medida de linearidade. O cálculo da covariância está respondendo à pergunta 'Os dados formam um padrão de linha reta?' Se os dados seguem um padrão linear, eles são dependentes. MAS, essa é apenas uma maneira pela qual os dados podem ser dependentes. É como perguntar 'Estou dirigindo de forma imprudente?' Uma pergunta pode ser 'Você está viajando 40 km / h acima do limite de velocidade?' Mas essa não é a única maneira de dirigir de forma imprudente. Outra pergunta poderia ser 'Você está bêbado?' etc. Há mais de uma maneira de dirigir de forma imprudente.
Adam
A chamada medida de linearidade dá uma estrutura ao relacionamento. O importante é que o relacionamento possa ser não linear, o que não é incomum. Geralmente, covariância não é zero, é hypothetical.The covariância indica a magnitude e não um rácio,
Subhash C. Davar

Respostas:

48

Exemplo fácil: Seja uma variável aleatória que seja - 1 ou + 1 com probabilidade 0,5. Então seja Y uma variável aleatória tal que Y = 0 se X = - 1 , e Y for aleatoriamente - 1 ou + 1 com probabilidade 0,5 se X = 1 .X1+1YY=0X=1Y1+1X=1

Claramente e Y são altamente dependentes (já que conhecer Y me permite conhecer perfeitamente X ), mas sua covariância é zero: ambos têm média zero eXYYX

E[XY]=(1)0P(X=1)+11P(X=1,Y=1)+1(1)P(X=1,Y=1)=0.

Ou, de maneira mais geral, considere qualquer distribuição e P ( Y | X ), de modo que P ( Y = a | X ) = P ( Y = - a | X ) para todo X (ou seja, uma distribuição conjunta que seja simétrica em torno do eixo x ) e você sempre terá covariância zero. Mas você não terá independência sempre que P ( Y | X ) P (P(X)P(Y|X)P(Y=a|X)=P(Y=a|X)Xx ; isto é, os condicionais não são todos iguais ao marginal. Ou o mesmo para simetria em torno doeixo y .P(Y|X)P(Y)y

jpillow
fonte
32

Aqui está o exemplo que sempre dou aos alunos. Pegue uma variável aleatória com E X = 0 e E X 3 = 0 , por exemplo, variável aleatória normal com média zero. Tome Y = X 2 . É claro que X e Y estão relacionados, masXEX=0EX3=0Y=X2XY

cov(X,Y)=EXYEXEY=EX3=0.
mpiktas
fonte
Eu também gosto desse exemplo. Como um caso particular, um N (0,1) rv e um chi2 (1) rv não são correlacionados.
Ocram
3
E[X3]=0E[X]=0E[X3]XN(0,1)X2χ2(1) N(0,1)χ2(1)
@DilipSarwate, obrigado, editei minha resposta de acordo. Quando o escrevi, pensei sobre variáveis ​​normais, para elas o terceiro momento zero segue a média zero.
Mvctas
19

A imagem abaixo (fonte Wikipedia ) possui vários exemplos na terceira linha, em particular o primeiro e o quarto exemplos têm uma forte relação dependente, mas 0 correlação (e 0 covariância).

insira a descrição da imagem aqui

naught101
fonte
15

Alguns outros exemplos, considere pontos de dados que formam um círculo ou elipse, a covariância é 0, mas sabendo que x você reduz y a 2 valores. Ou dados em um quadrado ou retângulo. Os dados que formam um X ou V ou ^ ou <ou> também fornecerão covariância 0, mas não são independentes. Se y = sin (x) (ou cos) ex cobre um múltiplo inteiro de períodos, cov será igual a 0, mas sabendo que x você conhece y ou pelo menos | y | na elipse, x, <e> casos.

Greg Snow
fonte
11
Que se deve ser "se x tampas de um múltiplo inteiro de períodos desde um pico ou vale", ou de forma mais geral: "Se x abrange um intervalo em que y é simétrica"
naught101
você poderia explicar por que a covariância é zero para um círculo?
user1993
11
@ user1993, veja a fórmula da covariância (ou correlação). Então pense no círculo / elipse. Subtrair as médias fornece um círculo centrado em (0,0); portanto, para cada ponto do círculo, você pode refletir o ponto ao redor do eixo x, do eixo y e de ambos os eixos para encontrar um total de 4 pontos contribua exatamente com o mesmo valor absoluto para a covariância, mas 2 será positivo e 2 será negativo, resultando em uma soma de 0. Faça isso para todos os pontos em um círculo e você adicionará um monte de 0 dando uma covariância total de 0.
Greg Snow