Quando A e B são variáveis ​​relacionadas positivamente, elas podem ter efeito oposto na variável de resultado C?

22

A está positivamente relacionado a B.

C é o resultado de A e B, mas o efeito de A em C é negativo e o efeito de B em C é positivo.

Isso pode acontecer?

Reen
fonte
Esta é uma relação no modelo em SEM
Reen
1
stats.stackexchange.com/q/33888/3277 é uma questão intimamente relacionada. Não é idêntico, mas as respostas podem ser extrapoladas até aqui.
ttnphns

Respostas:

43

As outras respostas são realmente maravilhosas - elas dão exemplos da vida real.

Quero explicar por que isso pode acontecer, apesar de nossa intuição em contrário.

Veja isso geometricamente !

Correlação é o cosseno do ângulo entre os vetores. Essencialmente, você está perguntando se é possível que

  • A faz umânguloagudocomB (correlaçãopositiva)
  • B faz umânguloagudocomC (correlaçãopositiva)
  • A faz umânguloobtusocomC (correlaçãonegativa)

Sim, claro:

insira a descrição da imagem aqui

Neste exemplo ( ρ indica correlação):

  • A=(0.6,0.8)
  • B=(1,0)
  • C=(0.6,0.8)
  • ρ(A,B)=0.6>0
  • ρ(B,C)=0.6>0
  • ρ(A,C)=0.28<0

Sua intuição está certa!

No entanto, sua surpresa não é extraviada.

O ângulo entre os vetores é uma métrica de distância na esfera unitária, portanto satisfaz a desigualdade do triângulo:

ABAC+BC

portanto, como cosAB=ρ(A,B) ,

arccosρ(A,B)arccosρ(A,C)+arccosρ(B,C)

portanto (como cos está diminuindo em [0,π] )

ρ(A,B)ρ(A,C)×ρ(B,C)(1ρ2(A,C))×(1ρ2(B,C))

Tão,

  • se ρ(A,C)=ρ(B,C)=0.9 , então ρ(A,B)0.62
  • se ρ(A,C)=ρ(B,C)=0.95 , então ρ(A,B)0.805
  • se ρ(A,C)=ρ(B,C)=0.99 , então ρ(A,B)0.9602
sds
fonte
32

Sim, duas condições simultâneas podem ter efeitos opostos.

Por exemplo:

  • Fazer declarações ultrajantes (A) está positivamente relacionado a ser divertido (B).
  • Fazer declarações ultrajantes (A) tem um efeito negativo sobre a vitória nas eleições (C).
  • Ser divertido (B) tem um efeito positivo em ganhar as eleições (C).
Matthew Gunn
fonte
20
Temos as melhores respostas. Ao melhor. Todo mundo diz isso.
Matthew Drury
1
Embora eu concorde com essa opinião política, acho que é uma má forma usar uma resposta neste site como veículo para uma opinião política irrelevante.
Kodiologist
14
@ Kodiologist Esta resposta não toma posição sobre nenhum candidato ou questão. Torna as observações (imho) razoavelmente comuns que: (1) candidatos divertidos têm uma vantagem (por exemplo, Ronald Reagan, Bill Clinton, Willie Brown) e (2) declarações altamente provocativas tendem a doer mais do que ajudam (é por isso que os políticos tendem a não fazer esses tipos de declarações). Se essa é uma zona sem graça, eu posso derrubá-la, mas acho que o que escrevi é incrivelmente benigno e incontroverso.
Matthew Gunn
19
Não vejo nenhuma referência política direta na resposta. Pode haver uma referência implícita, mas acho que isso não afeta a validade ou a adequação da resposta.
Glen_b -Reinstala Monica
28

Eu ouvi essa analogia do carro que se aplica bem à pergunta:

  • Dirigir em subida (A) está positivamente relacionado ao motorista pisar no acelerador (B)
  • A subida (A) afeta negativamente a velocidade do veículo (C)
  • Pisar no gás (B) afeta positivamente a velocidade do veículo (C)

A chave aqui é a intenção do motorista de manter uma velocidade constante (C); portanto, a correlação positiva entre A e B segue naturalmente essa intenção. Você pode construir infinitos exemplos de A, B, C com esse relacionamento assim.

A analogia vem de uma interpretação do termostato de Milton Friedman e de uma análise interessante da política monetária e da econometria, mas isso é irrelevante para a questão.

congusbongus
fonte
2
Belo exemplo. No entanto, não tenho certeza se você está usando os termos 'relacionados positivamente' e 'relacionados negativamente' como relações estatísticas (por exemplo, correlação), o que eu acho que é o que significa o op.
Lior Kogan
8

Sim, isso é trivial para demonstrar com uma simulação:

Simule 2 variáveis, A e B correlacionadas positivamente:

> require(MASS)
> set.seed(1)
> Sigma <- matrix(c(10,3,3,2),2,2)
> dt <- data.frame(mvrnorm(n = 1000, rep(0, 2), Sigma))
> names(dt) <- c("A","B")
> cor(dt)

          A         B
A 1.0000000 0.6707593
B 0.6707593 1.0000000

Crie a variável C:

> dt$C <- dt$A - dt$B + rnorm(1000,0,5)

Contemplar:

> (lm(C~A+B,data=dt))

Coefficients:
(Intercept)            A            B  
    0.03248      0.98587     -1.05113  

cor(A,B)>0cor(A,C)>0cor(B,C)<0

> set.seed(1)
> Sigma <- matrix(c(1,0.5,0.5,0.5,1,-0.5,0.5,-0.5,1),3,3)
> dt <- data.frame(mvrnorm(n = 1000, rep(0,3), Sigma, empirical=TRUE))
> names(dt) <- c("A","B","C")
> cor(dt)
    A    B    C
A 1.0  0.5  0.5
B 0.5  1.0 -0.5
C 0.5 -0.5  1.0
Robert Long
fonte
Eu acho que é melhor olhar cor(C, A)e do cor(C, B)que lm(C ~ A + B)aqui. Nós estamos interessados em, por exemplo, a relação descontrolada de A e C, em vez de essa relação controlado por B.
Kodiologist
@ Kodiologist the OP diz em seu comentário que o contexto é um SEM, o que implicaria uma regressão linear, eu acho.
Robert Long
@Kodiologist ver a atualização para a minha resposta :)
Robert Long
0

C=mB+n(UMA-projB(UMA))

então

C,UMA=mB,UMA+nUMA,UMA-nB,UMA

Então, a covariância entre C e A pode ser negativa em duas condições:

  1. n>m, UMA,UMA<B,UMA(n-m)/n
  2. n<m, A,A>B,A(nm)/n
Zhu Jinxuan
fonte