Se A e B estão correlacionados com C, por que A e B não estão necessariamente correlacionados?

62

Eu sei empiricamente que é o caso. Acabei de desenvolver modelos que se deparam com esse dilema. Eu também suspeito que não é necessariamente uma resposta sim / não. Quero dizer com isso, se A e B estão correlacionados com C, isso pode ter alguma implicação em relação à correlação entre A e B. Mas, essa implicação pode ser fraca. Pode ser apenas uma direção de sinal e nada mais.

Aqui está o que eu quero dizer ... Digamos que A e B tenham uma correlação de 0,5 com C. Dado que, a correlação entre A e B pode muito bem ser 1,0. Eu acho que também pode ser 0,5 ou até mais baixo. Mas acho que é improvável que seja negativo. Você concorda com aquilo?

Além disso, existe uma implicação se você estiver considerando o coeficiente de correlação padrão de Pearson ou o coeficiente de correlação de Spearman (classificação)? Minhas observações empíricas recentes foram associadas ao coeficiente de correlação de Spearman.

Sympa
fonte
38
Um exemplo é o de tomar , , e . Podemos assumir e para ser independente, no entanto, ambos e são correlacionados (positivamente, Pearson) com . UMA=XB=YC=X+YXYUMABC
1
Obrigado, esse é realmente um ótimo comentário. Curto, mas captura a essência da razão pela qual é.
Sympa

Respostas:

53

Como a correlação é uma propriedade matemática de distribuições multivariadas, alguns insights podem ser obtidos puramente através de cálculos, independentemente da gênese estatística dessas distribuições.

Para as correlações de Pearson , considerar variáveis multinormal , , . Eles são úteis para trabalhar, porque qualquer matriz definida não negativa é realmente a matriz de covariância de algumas distribuições multinormais, resolvendo assim a questão da existência. Se mantivermos matrizes com na diagonal, as entradas fora da diagonal da matriz de covariância serão suas correlações. Escrevendo a correlação de e como , a correlação de e como e a correlação de e comoXYZ1XYρYZτXZσ , calculamos que

  • 1+2ρστ-(ρ2+σ2+τ2)0 0 (porque esse é o determinante da matriz de correlação e não pode ser negativo).

  • Quando isso implica que . Em outras palavras: quando e são grandes em magnitude, e devem ter correlação diferente de zero.ρ 2 + τ 21 ρ τ X Zσ=0 0ρ2+τ21ρτXZ

  • Se , qualquer valor não negativo de (entre e , é claro) é possível.σ 0 1ρ2=τ2=1/2σ0 01

  • Quando , valores negativos de são permitidos. Por exemplo, quando , pode estar em qualquer lugar entre e .σ ρ = τ = 1 / 2 σ - 1 / 2 1ρ2+τ2<1σρ=τ=1/2σ-1/21

Essas considerações implicam que existem de fato algumas restrições nas correlações mútuas. As restrições (que dependem apenas da definição não-negativa da matriz de correlação, não das distribuições reais das variáveis) podem ser reforçadas, dependendo de suposições sobre as distribuições univariadas. Por exemplo, é fácil ver (e provar) que quando as distribuições de e não estão na mesma família de escala de local, suas correlações devem ser estritamente menores que em tamanho. (Prova: uma correlação de implica que e estão linearmente relacionados como)Y 1 ± 1 X YXY1±1XY

Quanto às correlações de Spearman , considere três observações triviais , e de . Suas correlações de classificação mútua são , e . Assim, mesmo o sinal da correlação de postos de e pode ser o inverso dos sinais das correlações de e e e .( 2 , 3 , 1 ) ( 3 , 2 , 3 ) ( X , Y , Z ) 1 / 2 1 / 2 - 1 / 2 Y Z X Y X Z(1,1,2)(2,3,1)(3,2,3)(X,Y,Z)1/21/21/2YZXYXZ

whuber
fonte
whuber, o que são "variáveis ​​multinormais"?
Sympa
Como sempre, para uma explicação mais completa, você recebe a merecida marca de "Melhor resposta".
Sympa
@ Gaetan Lion Você é muito gentil. Gostei de ler todas as respostas a esta pergunta (e as marquei todas).
whuber
88

Estou em uma viagem de pesca anual agora. Existe uma correlação entre a hora do dia em que pesco e a quantidade de peixes que pesco. Há também uma correlação entre o tamanho da isca que uso e a quantidade de peixe que pego. Não há correlação entre o tamanho da isca e a hora do dia.

Manjericão
fonte
Basil, eu adoro! +1 para uma explicação simples em inglês.
Sympa
Melhor. Responda. Em stats.stackexchange. Ever
Chris Beeley
1
Isso descreve um caso em que as correlações são baixas, mas não explica o caso em que as correlações são mais altas. Se houver uma correlação de 80% com a hora do dia e uma correlação de 80% com o tamanho da isca, garanto que você está usando uma isca maior durante o dia!
user35581
2
@ user35581 não, você não pode - você está perdendo todo o argumento. Toda hora ele pescava uma vez com isca pequena e outra com isca grande. Ele ainda pode capturar mais peixes durante certas partes do dia (correlação de 80%) e capturar mais peixes com isca maior (correlação de 80%) e há 0 correlação entre o tamanho da isca que ele está usando e a hora do dia. Pode até ser uma correlação negativa se ele usar iscas maiores com mais frequência fora do horário de pico do dia, a fim de compensar a má hora do dia. Então, você realmente não sabe nada sobre a correlação entre a hora do dia e o tamanho da isca.
precisa saber é o seguinte
2
@rysqui desculpe, meu comentário foi mal formulado, mas o ponto que eu estava tentando fazer era o seguinte: quando as correlações entre os recursos e o alvo ficam muito altas, seus recursos também devem estar correlacionados. Portanto, se você tem uma correlação perfeita entre a hora do dia e o tamanho da captura, e uma correlação perfeita entre o tamanho da isca e o tamanho da captura, também deve ter uma correlação perfeita entre o tamanho da isca e a hora do dia, daí a declaração final "você está usando isca maior durante o dia". Lembre-se de que este é um caso extremo!
user35581
20

Correlação é o cosseno do ângulo entre dois vetores. Na situação descrita, (A, B, C) é um triplo de observações, feitas n vezes, sendo cada observação um número real. A correlação entre A e B é o co-seno do ângulo entre e V B = B - E ( B ) tal como medido no espaço euclidiano n-dimensional. Portanto, nossa situação se reduz a considerar 3 vetores V A , V B e V CVA=AE(A)VB=BE(B)VAVBVCno espaço dimensional n. Temos 3 pares de vetores e, portanto, 3 ângulos. Se dois dos ângulos são pequenos (alta correlação), o terceiro também será pequeno. Mas dizer "correlacionado" não é muita restrição: significa que o ângulo está entre 0 e . Em geral, isso não dá nenhuma restrição ao terceiro ângulo. Em outras palavras, comece com qualquer ângulo menor que π entre V A e V B (qualquer correlação, exceto -1). Vamos V C bissetriz do ângulo entre V A e V B . Então C será correlacionado com A e B.π/2πVAVBVCVAVB

David Epstein
fonte
A correlação +1 em termos de ângulo entre vetores multidimensionais é intuitiva para mim.
Petrus Theron
2
Para a referência de futuros leitores, eu expandir esta resposta geométrica (com fotos!) Na seguinte discussão: talkstats.com/showthread.php/...
Jake Westfall
18

Como complemento da resposta do whuber's: A fórmula apresentada

.1+2ρστ(ρ2+σ2+τ2)0

pode ser transformado na seguinte desigualdade (Olkin, 1981):

στ-(1-σ2)(1-τ2)ρστ+(1-σ2)(1-τ2)

Uma representação gráfica dos limites superior e inferior para parece com:ρ

insira a descrição da imagem aqui


Olkin, I. (1981). Restrições de intervalo para matrizes de correlação produto-momento. Psychometrika, 46, 469-472. doi: 10.1007 / BF02293804

Felix S
fonte
Alguém pode me dizer se alguns desses exemplos são distribuições multivariadas que possuem distribuições marginais específicas que restringem o intervalo de possíveis correlações entre componentes? Isso significa que as correlações não podem variar de -1 a 1. Lembro que Frechet foi pelo menos uma pessoa que desenvolveu isso na década de 1950. Enquanto pesquiso a literatura hoje, acho que agora são chamadas de cópulas de Frechet.
Michael Chernick
14

Eu acho que é melhor perguntar "por que eles devem ser correlacionados?" ou, talvez "Por que deveria haver alguma correlação específica?"

O código R a seguir mostra um caso em que x1 e x2 estão correlacionados com Y, mas têm 0 correlação entre si

x1 <- rnorm(100)
x2  <- rnorm(100)
y <- 3*x1 + 2*x2 + rnorm(100, 0, .3)

cor(x1,y)
cor(x2,y)
cor(x1,x2)

A correlação com Y pode ser fortalecida reduzindo-se a 0,3 a 0,1 ou qualquer outra

Peter Flom - Restabelece Monica
fonte
Infelizmente, eu não sou um usuário R. Portanto, os códigos acima significam menos para mim do que para você.
Sympa
2
x1x2y=3x1+2x2yx1x2
14

Deixarei a demonstração estatística para aqueles que são mais adequados do que eu para ela ... mas, intuitivamente, digo que o evento A gera um processo X que contribui para a geração do evento C. Em seguida, A é correlacionado com C (através de X). B, por outro lado, gera Y, que também forma C. Portanto, A está correlacionado com C, B está correlacionado com C, mas A e B não estão correlacionados.

nico
fonte
1
@Agradável. Eu acho que você quer dizer "A e B não estão correlacionados" na última parte da sua última frase.
suncoolsu
Sim, Nico com correção de suncoolsu ... essa é uma explicação razoavelmente boa. Você está descrevendo parcialmente a Análise de caminho.
Sympa
Sim, desculpe, eu me misturei com as letras;)
nico
1

Para aqueles que querem alguma intuição, uma correlação pode ser vista como um cosseno de algum ângulo. Portanto, considere três vetores em 3D, digamos A, B e C, cada um correspondendo a uma variável. A questão é determinar a faixa de ângulos possíveis entre A e C quando o ângulo entre A e B e o ângulo entre B e C são conhecidos. Para isso, você pode jogar com uma ferramenta online sem instalar nenhum software. Basta ir para a página http://www.montefiore.ulg.ac.be/~pierard/chained_correlations.php

S. Piérard
fonte
0

Vamos dar um exemplo:

A={x1,x2,x3,x4,x5,x6,x7,x8,x9}

B={x1,x2,x3,0,0,0,0,0,0}

C={0,0,0,x4,x5,x6,0,0,0}

Para alguns x, A e B terão correlação significativa, da mesma forma A e C também terão correlação significativa, mas a correlação de B e C não será significativa.

Portanto, não é necessariamente verdade que se A e B se correlacionam e A e C se correlacionam, B e C também se correlacionam.

Nota: Para uma compreensão profunda, pense neste exemplo em grandes dados.

Abhishek Anand
fonte
BCx1x6UMABCx1x9
Sinto-me à vontade com a resposta de Abhishek Anand, porque, em última análise, tudo está correlacionado com tudo o mais em algum grau. E gosto da maneira como ele faz o benchmark em termos de significância estatística. Depois de usar essa estrutura, é bastante óbvio que, se A e B são estatisticamente correlacionados significativamente com C, A ou B podem não ser necessariamente estatisticamente significativamente correlacionados (usando a estrutura real da minha pergunta original). Acho que os diagramas de ventilação podem dar uma excelente explicação visual desse conceito.
precisa
@whuber eu concordo com você. Sua apenas um exemplo de amostra que explicar, porque não é necessário
Abhishek Anand
Tudo bem - mas você parece ter uma idéia errada sobre quais são as correlações entre esses vetores. Nenhuma das declarações que você faz sobre os coeficientes de correlação desses vetores geralmente está correta.
whuber