É possível que 3 vetores tenham todas as correlações negativas em pares?

16

Dado três vectores de a , b , e c , é possível que as correlações entre a e b , a e c , e b e c são todos negativos? Ou seja, isso é possível?

corr(a,b)<0corr(a,c)<0corr(b,c)<0
Antti A
fonte
3
Correlações negativas significam, geometricamente, que os vetores centralizados fazem mutuamente ângulos obtusos. Você não deve ter problemas ao desenhar uma configuração de três vetores no plano que possui essa propriedade.
whuber
Eles não podem ser completamente correlacionados negativamente ( ρ=1 ), mas em geral pode haver alguma correlação negativa, novamente limites estabelecidos pelas outras correlações.
precisa saber é
2
@whuber Seu comentário parece contradizer a resposta de Heikki Pulkkinen, que afirma ser impossível para vetores em um avião. Se você se mantiver firme, deverá transformar seu comentário em resposta.
RM
2
@ RM Não há contradição entre whuber e Heikki. Esta pergunta pergunta sobre a matriz de dados de tamanho n × 3 . Normalmente, falaríamos sobre n pontos de dados em 3 dimensões, mas este Q está falando de três "vetores" em n dimensões. Heikki diz que todas as correlações negativas não podem acontecer se n = 2Xn×3nnn=2 (de fato, dois pontos após a centralização são sempre perfeitamente correlacionados, portanto as correlações devem ser e não podem ser todas - 1 ). Whuber diz que 3 vetores em n dimensões podem efetivamente residir em um subespaço bidimensional (ie X±11nXclassificação 2) e sugere imaginar um logotipo da Mercedes.
ameba diz Restabelecer Monica
1
Relacionado: Limite para a correlação de três variáveis ​​aleatórias . (cc, @amoeba)
gung - Reinstate Monica

Respostas:

19

É possível se o tamanho do vetor for 3 ou maior. Por exemplo

a=(1,1,1)b=(1,9,3)c=(2,3,1)

As correlações são

cor(a,b)=0.80...cor(a,c)=0.27...cor(b,c)=0.34...

Podemos provar que para vetores de tamanho 2 isso não é possível:

cor(a,b)<02(iaibi)(iai)(ibi)<02(a1b1+a2b2)(a1+a2)(b1b2)<02(a1b1+a2b2)(a1+a2)(b1b2)<02(a1b1+a2b2)a1b1+a1b2+a2b1+a2b2<0a1b1+a2b2a1b2+a2b1<0a1(b1b2)+a2(b2b1)<0(a1a2)(b1b2)<0

A fórmula faz sentido: se é maior que a 2 , b 1 deve ser maior que b 1 para tornar a correlação negativa.a1a2b1b1

Da mesma forma, para correlações entre (a, c) e (b, c) obtemos

(a1a2)(c1c2)<0(b1b2)(c1c2)<0

Claramente, todas essas três fórmulas não podem ser mantidas ao mesmo tempo.

Heikki Pulkkinen
fonte
3
Outro exemplo de algo inesperado que só acontece na dimensão três ou superior.
enésimo
1
2±11
9

Sim eles podem.

XR3,XN(0,Σ). The only restriction on Σ is that it has to be positive semi-definite.

So take the following example Σ=(10.20.20.210.20.20.21)

Its eigenvalues are all positive (1.2, 1.2, 0.6), and you can create vectors with negative correlation.

Kozolovska
fonte
7

let's start with a correlation matrix for 3 variables

Σ=(1pqp1rqr1)

non-negative definiteness creates constraints for pairwise correlations p,q,r which can be written as

pqrp2+q2+r212

For example, if p=q=1, the values of r is restricted by 2rr2+1, which forces r=1. On the other hand if p=q=12, r can be within 2±34 range.

Answering the interesting follow up question by @amoeba: "what is the lowest possible correlation that all three pairs can simultaneously have?"

Let p=q=r=x<0, Find the smallest root of 2x33x2+1, which will give you 12. Perhaps not surprising for some.

A stronger argument can be made if one of the correlations, say r=1. From the same equation 2pqp2+q2, we can deduce that p=q. Therefore if two correlations are 1, third one should be 1.

karakfa
fonte
2

A simple R function to explore this:

f <- function(n,trials = 10000){
  count <- 0
  for(i in 1:trials){
    a <- runif(n)
    b <- runif(n)
    c <- runif(n)
    if(cor(a,b) < 0 & cor(a,c) < 0 & cor(b,c) < 0){
      count <- count + 1
    }
  }
  count/trials
}

As a function of n, f(n) starts at 0, becomes nonzero at n = 3 (with typical values around 0.06), then increases to around 0.11 by n = 15, after which it seems to stabilize:

enter image description here So, not only is it possible to have all three correlations negative, it doesn't seem to be terribly uncommon (at least for uniform distributions).

John Coleman
fonte