Significado de correlação parcial

9

Da Wikipedia

Formalmente, a correlação parcial entre X e Y dado um conjunto de n variáveis ​​de controle Z={Z1,Z2,,Zn} , escrita , é a correlação entre os resíduos RX e RY resultantes de a regressão linear de X com Z e de Y com Z , respectivamente.ρXY·ZRXRYXZYZ

  1. Diz anteriormente que

    a correlação parcial mede o grau de associação entre duas variáveis ​​aleatórias, removendo o efeito de um conjunto de variáveis ​​aleatórias de controle.

    Eu queria saber como a correlação parcial ρXY·Z está relacionada à correlação entre X e Y condicional em Z ?

  2. Há um caso especial para n=1 .

    De fato, a correlação parcial de primeira ordem (isto é, quando ) nada mais é do que uma diferença entre uma correlação e o produto das correlações removíveis dividido pelo produto dos coeficientes de alienação das correlações removíveis. O coeficiente de alienação e sua relação com a variação conjunta por meio da correlação estão disponíveis em Guilford (1973, pp. 344-345).n=1

    Eu queria saber como escrever o acima descrito matematicamente?

Tim
fonte

Respostas:

7

Observe que a correlação condicional em é uma variável que depende de , enquanto a correlação parcial é um número único.ZZ

Além disso, a correlação parcial é definida com base nos resíduos da regressão linear. Assim, se a relação real é não-linear, a correlação parcial pode obter um valor diferente do que a correlação condicional, mesmo se a correlação condicional em é uma constante independente de . Por outro lado, são gaussianos multivariados, a correlação parcial é igual à correlação condicional.ZZX,Y,X

Para um exemplo em que correlação condicional constante correlação parcial: Independentemente do valor que assumir, a correlação condicional será -1. No entanto, as regressões lineares , serão constantes 0 e, portanto, os resíduos serão os próprios valores ,Assim, a correlação parcial é igual à correlação entre , ; que não é igual a -1, pois claramente as variáveis ​​não estão perfeitamente correlacionadas se não for conhecido.

Zvocê(-1,1), X=Z2+e, Y=Z2-e, eN(0 0,1),eZ.
ZX|ZY|ZXYXYZ

Aparentemente, Baba e Sibuya (2005) mostram a equivalência de correlação parcial e correlação condicional para algumas outras distribuições além de gaussiana multivariada, mas não li isso.

A resposta à sua pergunta 2 parece existir no artigo da Wikipedia, a segunda equação em Usando a fórmula recursiva .

Juho Kokkala
fonte