Limite para a correlação de três variáveis ​​aleatórias

28

Existem três variáveis ​​aleatórias, x,y,z . As três correlações entre as três variáveis ​​são as mesmas. Isso é,

ρ=cor(x,y)=cor(x,z)=cor(y,z)

Qual é o limite mais rígido que você pode dar para ρ ?

user1352399
fonte
1
Presumivelmente por "pho", você quer dizer rho ( ρ ). No entanto, sua pergunta não está clara. O que você quer dizer com "Qual é o limite mais forte que você pode dar"?
gung - Restabelece Monica
Bem, o nome da variável é apenas um manequim. Por limite mais restrito, quero dizer algo como [-1, 1] para uma correlação, mas esse claramente não é o limite mais restrito possível.
user1352399
Você quer dizer que rho = cor (x, y) = cor (x, z) = cor (y, z) e quais são os limites para rho?
user31264
Sim, quero dizer que rho = cor (x, y) = cor (x, z) = cor (y, z) e quais são os limites para rho. Dilip, você pode estender isso para dizer que rho deve ser não negativo, ou seja,> = 0?
user1352399
1
Um livro citar para isso é Seber & Lee "Análise de Regressão Linear" (Pelo menos era na primeira edição ...)
Kjetil b Halvorsen

Respostas:

29

A correlação comum pode ter valor + 1 mas não - 1 . Se ρ X , Y = ρ X , Z = - 1 , então ρ Y , Z não pode ser igual a - 1, mas é de fato + 1 . O menor valor da correlação comum de três variáveis ​​aleatórias é - 1ρ+11ρX,Y=ρX,Z=1ρY,Z1+1 . De maneira mais geral, a correlação mínima comum denvariáveis ​​aleatórias é-112n quando, considerados como vetores, estão nos vértices de um simplex (da dimensãon-1) noespaçon-dimensional.1n1n1n

Considere a variação da soma de variáveis ​​aleatórias de variação unitária X i . Temos essa var ( n i = 1 X i )nXi onde ˉ ρ é ovalor médiodoscoeficientes de correlação. Mas como, obtemos facilmente esse

var(i=1nXi)=i=1nvar(Xi)+i=1njincov(Xi,Xj)=n+i=1njinρXi,Xj(1)=n+n(n1)ρ¯
ρ¯ var(ΣiXi)0(1) ˉ p-1(n2)var(iXi)0(1)
ρ¯1n1.

Portanto, o valor médio de um coeficiente de correlação é pelo menos . Se todos os coeficientes de correlação tiverem o mesmo valor , sua média também será igual a e, portanto, temos esse É possível ter variáveis aleatórias para o qual a correlação valor comum é igual a ? Sim. Suponha que os sejam variáveis ​​aleatórias de variação unitária não correlacionadas e defina . Então, , enquanto ρρρ-11n1ρρρ-1

ρ1n1.
ρ XiYi=Xi-11n1Xi E[Yi]=0var(Yi)= ( n - 1Yi=Xi1nj=1nXj=XiX¯E[Yi]=0 cov(Yi,Yj)=-2(n-1
var(Yi)=(n1n)2+(n1)(1n)2=n1n
e fornecendo Portanto, são variáveis ​​aleatórias que atingem o valor mínimo de correlação comum de . Note, aliás, que e, portanto, consideradas como vetores, as variáveis ​​aleatórias estão em um hiperplano dimensional de ρYi,Yj=cov(Yi,Yj)
cov(Yi,Yj)=2(n1n)(1n)+(n2)(1n)2=1n
Yi-1
ρYi,Yj=cov(Yi,Yj)var(Yi)var(Yj)=1/n(n1)/n=1n1.
Yi ΣiYi=0(n-1)n1n1iYi=0(n1)nespaço tridimensional.
Dilip Sarwate
fonte
25

O limite mais apertado possível é . 1/2ρ1 Todos esses valores podem realmente aparecer - nenhum é impossível.

Para mostrar que não há nada especialmente profundo ou misterioso sobre o resultado, essa resposta apresenta primeiro uma solução completamente elementar, exigindo apenas o fato óbvio de que as variações - sendo os valores esperados dos quadrados - devem ser não-negativas. Isto é seguido por uma solução geral (que usa fatos algébricos um pouco mais sofisticados).

Solução elementar

A variação de qualquer combinação linear de deve ser não negativa. x,y,z Seja a variação dessas variáveis e , respectivamente. Todos são diferentes de zero (caso contrário, algumas das correlações não seriam definidas). Usando as propriedades básicas das variações, podemos calcularυ 2σ2,τ2,υ2

0Var(αx/σ+βy/τ+γz/υ)=α2+β2+γ2+2ρ(αβ+βγ+γα)

para todos os números reais .(α,β,γ)

Supondo , um pouco de manipulação algébrica implica que isso é equivalente aα+β+γ0

ρ1ρ13((α2+β2+γ2)/3(α+β+γ)/3)2.

O termo do quadrado no lado direito é a razão de duas médias de potência de . A desigualdade média da potência elementar (com pesos ) afirma que a razão não pode exceder (e será igual a quando ). Um pouco mais de álgebra implica(α,β,γ)(1/3,1/3,1/3)11α=β=γ0

ρ1/2.

O exemplo explícito de abaixo (envolvendo variáveis ​​normais trivariadas ) mostra que todos esses valores, , realmente surgem como correlações. Este exemplo usa apenas a definição de normais multivariados, mas não invoca nenhum resultado de cálculo ou álgebra linear.n=3(x,y,z)1/2ρ1

Solução geral

visão global

Qualquer matriz de correlação é a matriz de covariância das variáveis ​​aleatórias padronizadas, de onde - como todas as matrizes de correlação - deve ser semi-definida positiva. Equivalentemente, seus valores próprios são não negativos. Isso impõe uma condição simples em : não deve ser inferior a (e, é claro, não pode exceder ). Inversamente, qualquer um desses na verdade corresponde à matriz de correlação de alguma distribuição trivariada, provando que esses limites são os mais rígidos possíveis.ρ1/21ρ


Derivação das condições emρ

Considere o por matriz de correlação com os valores de fora da diagonal igual a(A pergunta diz respeito ao caso mas essa generalização não é mais difícil de analisar.) Vamos chamá-lo de Por definição, é um autovalor desde que exista um vetor diferente de zero , de forma quennρ.n=3,C(ρ,n).λxλ

C(ρ,n)xλ=λxλ.

Esses valores próprios são fáceis de encontrar no presente caso, porque

  1. Permitindo , calcule isso1=(1,1,,1)

    C(ρ,n)1=(1+(n1)ρ)1.
  2. Deixando com somente no lugar (para ), calcule issoyj=(1,0,,0,1,0,,0)1jthj=2,3,,n

    C(ρ,n)yj=(1ρ)yj.

Como os autovetores encontrados até o momento abrangem todo o espaço dimensional (prova: uma redução fácil de linha mostra o valor absoluto de seus determinantes iguais a , que é diferente de zero), eles constituem a base de todos os autovetores. Encontramos, portanto, todos os autovalores e determinamos que sejam ou (este último com multiplicidade ). Além da conhecida desigualdade satisfeita por todas as correlações, a não negatividade do primeiro valor próprio implica ainda maisnnn1+(n1)ρ1ρn11ρ1

ρ1n1

enquanto a não negatividade do segundo valor próprio não impõe novas condições.


Prova de suficiência das condições

As implicações funcionam em ambas as direções: desde a matriz é definida como não-negativa e, portanto, é uma matriz de correlação válida. É, por exemplo, a matriz de correlação para uma distribuição multinormal. Especificamente, escreva1/(n1)ρ1,C(ρ,n)

Σ(ρ,n)=(1+(n1)ρ)Inρ(1ρ)(1+(n1)ρ)11

para o inverso de quando Por exemplo, quandoC(ρ,n)1/(n1)<ρ<1.n=3

Σ(ρ,3)=1(1ρ)(1+2ρ)(ρ+1ρρρρ+1ρρρρ+1).

Deixe o vetor de variáveis ​​aleatórias ter função de distribuição(X1,X2,,Xn)

fρ,n(x)=exp(12xΣ(ρ,n)x)(2π)n/2((1ρ)n1(1+(n1)ρ))1/2

onde . Por exemplo, quando isso é igual ax=(x1,x2,,xn)n=3

1(2π)3(1ρ)2(1+2ρ)exp((1+ρ)(x2+y2+z2)2ρ(xy+yz+zx)2(1ρ)(1+2ρ)).

A matriz de correlação para essas variáveis ​​aleatórias énC(ρ,n).

Figura

Contornos das funções de densidade Da esquerda para a direita, . Observe como a densidade muda de concentrada perto do plano para concentrada perto da linha .fρ,3.ρ=4/10,0,4/10,8/10x+y+z=0x=y=z

Os casos especiais e também podem ser realizados por distribuições degeneradas ; Não entrarei em detalhes, exceto para salientar que, no primeiro caso, a distribuição pode ser considerada suportada no hiperplano , onde é uma soma de significados distribuídos de forma idêntica Distribuição normal, enquanto no último caso (correlação positiva perfeita) ela é suportada na linha gerada por , onde tem uma distribuição média- Normal.ρ=1/(n1)ρ=1x.1=0010


Mais sobre a não degeneração

Uma revisão dessa análise deixa claro que a matriz de correlação tem uma classificação de e tem uma classificação de (porque apenas um vetor próprio possui um valor próprio diferente de zero). Para , isso torna a matriz de correlação degenerada em ambos os casos. Caso contrário, a existência de seu inverso prova que não é regenerado.C(1/(n1),n)n1C(1,n)1n2Σ(ρ,n)

whuber
fonte
20

Sua matriz de correlação é

(1ρρρ1ρρρ1)

A matriz é positiva semidefinida se os principais menores principais não forem negativos. Os principais menores são os determinantes dos blocos "noroeste" da matriz, ou seja, 1, o determinante de

(1ρρ1)

e o determinante da própria matriz de correlação.

1 é obviamente positivo, o segundo menor principal é , o que não é negativo para qualquer correlação admissível . O determinante de toda a matriz de correlação é1ρ2ρ[1,1]

2ρ33ρ2+1.

O gráfico mostra o determinante da função no intervalo de correlações admissíveis . [1,1]insira a descrição da imagem aqui

Você vê que a função não é negativa no intervalo fornecido por @stochazesthai (que você também pode verificar encontrando as raízes da equação determinante).

Christoph Hanck
fonte
Não estamos assumindo na sua resposta que ? Por que nós podemos? Var()=1
Um velho no mar.
1
@Anold Você parece estar lendo "covariância" onde "correlação" está escrita.
whuber
6

Existem variáveis ​​aleatórias , e com correlações aos pares se e somente se a matriz de correlação for semidefinida positiva. Isso acontece apenas para .Y Z ρ X Y = ρ Y Z = ρ X Z = ρ ρ [ - 1XYZρXY=ρYZ=ρXZ=ρρ[12,1]

stochazesthai
fonte
2
você pode explicar isso em termos muito simples?
Elizabeth Elizabeth Joseph #
1
Eu não acho que exista uma explicação que não exija o conhecimento de álgebra matricial. Eu sugiro que você olhe a página da Wikipedia ( en.wikipedia.org/wiki/… ).
precisa saber é o seguinte
4
Encontrei uma explicação que requer apenas álgebra básica (ensino médio) e a incluí na minha resposta.
whuber