As variáveis ​​aleatórias estão correlacionadas se, e somente se, suas fileiras estão correlacionadas?

20

Suponha que X,Y são variáveis ​​aleatórias contínuas com segundos momentos finitos. A versão populacional do coeficiente de correlação de Spearman pode ser definida como o coeficiente produto-momento de Pearson ρ das integrais de probabilidade transforma e , onde são os de e , ou seja,ρsFX(X)FY(Y)FX,FYXY

ρs(X,Y)=ρ(F(X),F(Y)) .

Gostaria de saber se geralmente podemos concluir que

ρ(X,Y)0 0ρ(F(X),F(Y))0 0 ?

Ou seja, temos correlação linear se e somente se tivermos correlação linear entre as fileiras?

Atualização: Nos comentários, dois exemplos são dados por que

ρ(FX(X),FY(Y))=0 0ρ(X,Y)=0 0

não é verdade em geral, mesmo que e tenham a mesma distribuição. Portanto, a questão deve ser reformulada comoYXY

ρ(X,Y)=0 0ρ(FX(X),FY(Y)) ?

Também é de grande interesse para mim se isso é verdadeiro / falso se e tiverem a mesma distribuição.YXY

(Nota: Se e Y dependem positivamente do quadrante, ou seja, δ (x, y) = F_ {X, Y} (x, y) –F_X (x) F_Y (y)> 0 , a fórmula de covariância de Hoeffding Cov (X , Y) = ∫∫δ (x, y) dxdy produz que ρ (X, Y)> 0 e ρ (F (X), F (Y))> 0. )Y δ ( x , y ) = F X , Y ( x , y ) - F X ( x ) F Y ( y ) > 0 C o v ( X , Y ) = δ ( x , y ) d x d y ρ ( X , Y ) > 0 ρXYδ(x,y)=FX,Y(x,y)-FX(x)FY(y)>0 0Cov(X,Y)=δ(x,y)dxdyρ(X,Y)>0 0ρ(F(X),F(Y))>0 0

FSpanhel
fonte
4
Dica: para obter uma resposta, pense no que acontece com cada medida de correlação sob uma transformação estritamente monotônica arbitrária.
cardeal
1
@ cardinal: bem, o rho de spearman é invariante sob transformações estritamente monotônicas, o coeficiente de correlação linear clássico mudará, mas não está claro como (?) ... em particular, eu não sei se o valor da correlação linear pode alterar seu valor de zero para diferente de zero sob transformações estritamente monotônicas ... mas talvez eu tenha perdido o seu argumento?
precisa saber é
Você está no caminho certo! Seja e . Agora, observe as transformações estritamente monotônicas desses dois. Não verifiquei explicitamente, mas é provável que funcione. XN(0 0,1)Y=X2g(z)=exp(-z/2)
cardeal
2
Você está correto. O segundo exemplo não funciona como eu pretendia / suspeitei. No entanto, o princípio geral de como construir esse contra-exemplo ainda é válido. E, sim, esse assunto pode estar intimamente ligado a cópulas. :-)
cardeal
2
Depois de confirmar seus contra-exemplos, considere escrevê-los em uma resposta a esta postagem. Ficarei feliz em votar novamente. Felicidades.
cardeal

Respostas:

8

Nenhuma correlação sendo zero necessariamente informa muito sobre a outra, pois elas 'ponderam' os dados - especialmente dados extremos - de maneira bastante diferente. Vou apenas brincar com amostras, mas exemplos semelhantes podem ser construídos com distribuições / cópulas bivariadas.

1. A correlação de Spearman 0 não implica a correlação de Pearson 0 :

Como mencionado na pergunta, há exemplos nos comentários, mas a estrutura básica é "construa um caso em que a correlação de Spearman seja 0, então pegue um ponto extremo e o torne mais extremo sem alterar a correlação de Spearman"

Os exemplos nos comentários cobrem isso muito bem, mas vou apenas brincar com um exemplo mais 'aleatório' aqui. Portanto, considere esses dados (em R), que por construção têm correlação de Spearman e Pearson 0:

x=c(0.660527211673069, 0.853446087136149, -0.00673848667511427, 
-0.730570343152498, 0.0519171047989013, 0.00190761493801791, 
-0.72628058443299, 2.4453231076856, -0.918072410495674, -0.364060229489348, 
-0.520696233492491, 0.659907250608776)
y=c(-0.0214697990371976, 0.255615059485107, 1.10561181413232, 0.572216886959267, 
-0.929089680725018, 0.530329993414123, -0.219422799586819, -0.425186120279194, 
-0.848952532832652, 0.859700836483046, -0.00836246690850083, 
1.43806947831794)

cor(x,y);cor(x,y,method="sp")
[1] 1.523681e-18
[1] 0

Agora adicione 1000 a y [12] e subtraia 0,6 de x [9]; a correlação de Spearman permanece inalterada, mas a correlação de Pearson agora é de 0,1841:

  ya=y
  ya[12]=ya[12]+1000
  xa=x
  xa[9]=xa[9]-.6
  cor(xa,ya);cor(xa,ya,method="sp")
[1] 0.1841168
[1] 0

(Se você deseja uma forte significância nessa correlação de Pearson, basta replicar a amostra inteira várias vezes.)

2. A correlação 0 de Pearson não implica a correlação 0 de Spearman :

Aqui estão dois exemplos com correlação de Pearson nula, mas correlação de Spearman diferente de zero (e, novamente, se você quiser uma forte significância nessas correlações de Spearman, apenas replique a amostra inteira várias vezes).

Exemplo 1:

 x1=c(rep(-3.4566679074320789866,20),-2:5)
 y1=x1*x1
 cor(x1,y1);cor(x1,y1,method="spe")
[1] -8.007297e-17 
[1] -0.3512699   

pontos em uma parábola dispostos a dar 0 Pearson, mas correlação de Spearman diferente de zero

Exemplo 2:

 k=16.881943016134132 
 x2=c(-9:9,-k,k)
 y2=c(-9:9,k,-k)
 cor(x2,y2);cor(x2,y2,method="spe")
[1] -9.154471e-17
[1] 0.4805195

pontos em ay = x linha, exceto o menor e o maior que se encontram em y = -x

Neste último exemplo, a correlação de Spearman pode ser fortalecida adicionando mais pontos em y = x, ao mesmo tempo em que os dois pontos no canto superior esquerdo e no canto inferior direito são mais extremos para manter a correlação de Pearson em 0.

Glen_b -Reinstate Monica
fonte