A causalidade implica correlação?

118

A correlação não implica causalidade, pois pode haver muitas explicações para a correlação. Mas a causalidade implica correlação? Intuitivamente, eu pensaria que a presença de causação significa que há necessariamente alguma correlação. Mas minha intuição nem sempre me serviu bem em estatística. A causalidade implica correlação?

Mateus
fonte
5
O problema é que, se você procurar "implicar" em um dicionário, verá "sugerir" e "necessário".
Roland2
6
Correlação não implica causalidade, mas balança as sobrancelhas sugestivamente e gesticula furtivamente enquanto fala "olhe para lá". xkcd.com/552
jchristie 28/02
11
A pergunta em si não parece estar procurando uma resposta específica e factual, conforme indicado pelo uso da palavra implicar. A referência acima é como um último talvez. Ou mais como um provavelmente, mas não posso provar.
jchristie

Respostas:

96

Como muitas das respostas acima afirmaram, a causação não implica correlação linear . Como muitos dos conceitos de correlação vêm de campos que dependem fortemente de estatísticas lineares, geralmente a correlação é vista como igual à correlação linear. O artigo da Wikipedia é uma boa fonte para isso, eu realmente gosto desta imagem:

Exemplos de correlação

Veja algumas das figuras na linha inferior, por exemplo, a forma parábola no quarto exemplo. É o que acontece na resposta do @StasK (com um pouco de ruído adicionado). Y pode ser totalmente causado por X, mas se o relacionamento numérico não for linear e simétrico, você ainda terá uma correlação de 0.

A palavra que você procura é informação mútua : esse é o tipo de versão geral não linear da correlação. Nesse caso, sua afirmação seria verdadeira: a causação implica em alta informação mútua .

Artem Kaznatcheev
fonte
3
Geralmente, mas nem sempre é verdade, que altas informações mútuas acompanham a causalidade. Veja a resposta de @ gung onde "se a causa estiver perfeitamente correlacionada com outra variável causal com exatamente o efeito oposto".
Neil G
5
O argumento de duas causas com efeitos opostos que sempre se cancelam não faz muito sentido para mim como causa . Sempre posso assumir que há unicórnios causando alguma coisa e gremlins cancelando seus esforços perfeitamente; Eu evito isso, pois é bobagem. Mas talvez eu esteja entendendo mal o seu ponto.
Artem Kaznatcheev
11
Seu exemplo é mais extremo do que precisa ser. É possível que você tenha variáveis ​​booleanas e modo que e sejam causas de e (mod 2). Então, ausente do conhecimento de , e não há informações mútuas. é um fator de confusão não descoberto - o que você está chamando de "gremlins", mesmo que seja algo muito comum. A,BCABCC=A+BBACB
Neil G
2
@NielG Concordo com sua primeira frase, mas não com a segunda. Só porque A & B causa C, não significa que A causa C e B causa C. Não vejo por que a causa precisa ser distributiva sobre &.
Artem Kaznatcheev 13/04
4
A razão que A é, no entanto, uma causa de C é porque mudar Ainda vai mudar C. Então, C é dependente de um mesmo quando não observamos B.
Neil G
41

A resposta estrita é "não, a causa não implica necessariamente correlação".

Considere e . Causalidade não existe nada mais forte: determina . No entanto, a correlação entre e é 0. Prova: Os momentos (conjuntos) dessas variáveis ​​são: ; ; usando a propriedade da distribuição normal padrão de que seus momentos ímpares são todos iguais a zero (pode ser facilmente derivada de sua função geradora de momentos, por exemplo). Portanto, a correlação é igual a zero.XN(0,1)Y=X2χ12XYXYE[X]=0E[Y]=E[X2]=1

Cov[X,Y]=E[(X0)(Y1)]=E[XY]E[X]1=E[X3]E[X]=0

Para abordar alguns dos comentários: a única razão pela qual esse argumento funciona é porque a distribuição de é centrada em zero e é simétrica em torno de 0. De fato, qualquer outra distribuição com essas propriedades com número suficiente de momentos teria funcionado. local de , por exemplo, uniforme em ou Laplace . Um argumento simplificado é que, para todo valor positivo de , existe um valor negativo igualmente provável de da mesma magnitude; portanto, quando você quadraciona o , não pode dizer que valores maiores de estão associados a valores maiores ou menores deXN(0,1)(10,10)exp(|x|)XXXXY. No entanto, se você escolher , então , , e . Isto faz todo o sentido: para cada valor de abaixo de zero, existe um valor muito mais provável de que é acima de zero, por isso, maiores valores de estão associadas com maiores valores de . (A última possui uma distribuição não central ; você pode obter a variação da página da Wikipedia e calcular a correlação, se estiver interessado.)XN(3,1)E[X]=3E[Y]=E[X2]=10E[X3]=36X - X X Y χ 2Cov[X,Y]=E[XY]E[X]E[Y]=3630=60XXXYχ2

StasK
fonte
2
@DQdlM: A variável aleatória padrão tem momentos centrais estranhos que desaparecem , devido à uniformidade da densidade. Matthew: A resposta é não, como o StasK demonstrou, porque a correlação não é o único tipo de dependência.
Emre
3
@DQdlM: veja o gráfico do meio na primeira imagem na página de correlação da Wikipedia . Esse é o caso de StasK. Ele só funciona quando x é igualmente distribuída sobre a origem (isto é, se , a correlação será bastante elevado)XN(3,1)
naught101
3
PS Estou tão feliz que você postou esta resposta. Era difícil acreditar que a pergunta demorou tanto tempo sem essa resposta. Este foi o exemplo exato que me veio à mente quando vi essa pergunta, mas não tive tempo para escrevê-la. Estou feliz que você fez tomar o tempo. Felicidades.
cardeal
3
@ cardinal: sim, acho que todos nós aprendemos esse tipo de contra-exemplo simples na pós-graduação ... e sim, a partir da derivação da covariância, você só precisa que o primeiro e o terceiro momentos sejam zero. Se você tem um exemplo não trivial de uma distribuição assimétrica que tem um terceiro momento zero (massas de probabilidade afinadas com mais de cinco ou seis pontos não contam), eu ficaria muito curioso para vê-lo.
StasK:
3
Aqui, a 'causalidade' está sendo assumida como expressável como uma função. Ou seja, causa se, e somente se, existe uma função mensurável, , tal que . Acho que poderíamos passar o resto de nossas vidas discutindo sobre a validade desse argumento. Y f Y = f ( X )XYfY=f(X)
31

Essencialmente sim.

A correlação não implica causalidade porque poderia haver outras explicações para uma correlação além da causa. Mas, para que A seja uma causa de B, eles devem estar associados de alguma forma . Significando que há uma correlação entre eles - embora essa correlação não precise necessariamente ser linear.

Como alguns dos comentaristas sugeriram, provavelmente é mais apropriado usar um termo como 'dependência' ou 'associação' em vez de correlação. Embora, como mencionei nos comentários, vi "correlação não significa causalidade" em resposta à análise muito além da simples correlação linear, e, para os propósitos do ditado, estendi essencialmente a "correlação" a qualquer associação entre A e B.

Fomite
fonte
16
Costumo reservar a palavra correlação para correlação linear e usar dependência para relações não lineares que podem ou não ter correlação linear.
Memming
4
@ Memming Eu também, salvo pelo fato de que as pessoas excluem "Correlação não implica causalidade" re: associação não linear bastante complexa.
Fomite 11/04
Memming está certo. Você precisa definir a correlação se não se referir à correlação de Pearson.
31512 Neil G
11
@ NeilG Ou, nesse caso, é possível obter uma correlação linear de Pearson transformando uma variável ou outra. O problema é que o ditado em si é simplificado demais.
Fomite 11/04
11
@EpiGrad: Ambos os bons pontos. Na linguagem comum, a correlação é apenas mais A coincide com mais B. Acho que sua resposta se beneficiaria em tornar clara a sua utilização de uma ampla definição de correlação.
Neil G
23

Adicionando à resposta do @EpiGrad. Eu acho que, para muitas pessoas, "correlação" implicará "correlação linear". E o conceito de correlação não linear pode não ser intuitivo.

Então, eu diria "não, eles não precisam ser correlacionados, mas precisam ser relacionados ". Estamos concordando com a substância, mas discordando sobre a melhor maneira de transmitir a substância.

Um exemplo dessa causa (pelo menos as pessoas pensam que é causal) é entre a probabilidade de atender o telefone e a renda. Sabe-se que as pessoas de ambos os lados do espectro de renda têm menos probabilidade de atender seus telefones do que as pessoas do meio. Pensa-se que o padrão causal seja diferente para os pobres (por exemplo, evite cobradores) e ricos (por exemplo, evite as pessoas pedindo doações).

Peter Flom
fonte
21

As coisas são definitivamente sutis aqui. Causar não implica correlação nem dependência estatística, pelo menos não da maneira simples como geralmente pensamos sobre elas, ou da maneira que algumas respostas sugerem (apenas transformando ou etc).XY

Considere o seguinte modelo causal:

XYU

Ou seja, ambos e causa .XUY

Agora deixe:

Xbernoulli(0.5)Ubernoulli(0.5)Y=1XU+2XU

Suponha que você não observar . Observe que . Ou seja, mesmo que cause (no sentido da equação estrutural não paramétrica), você não vê nenhuma dependência! Você pode fazer qualquer transformação não linear que desejar e que não revelará nenhuma dependência, porque não há nenhuma dependência marginal de e aqui.UP(Y|X)=P(Y)XYYX

O truque é que, apesar de e causarem , marginalmente seu efeito causal médio é zero. Você só vê a dependência (exata) ao condicionar e juntos (isso também mostra que e não implica ). Então, sim, pode-se argumentar que, embora causa , o efeito causal marginal de em é zero, então é por isso que não vemos a dependência de e . Mas isso apenas ilustra como o problema é sutil, porqueU Y X U X Y U Y { X , U } Y X Y X Y X Y X Y UXUYXUXYUY {X,U}YXYXYXYXcausa , não apenas da maneira que você pensaria ingenuamente (ele interage com ).YU

Então, resumindo, eu diria que: (i) a causalidade sugere dependência; mas (ii) a dependência é funcional / estrutural e pode ou não ser traduzida na dependência estatística específica em que você está pensando.

Carlos Cinelli
fonte
Carlos, é correto dizer que, se conhecermos todo o conjunto de variáveis ​​envolvidas no modelo causal, esse problema (invisibilidade estatística) desaparece?
markowitz
@markowitz, você precisaria observar tudo no nível determinístico, portanto, não é um cenário muito realista.
Carlos Cinelli
Eu interpreto sua resposta como "sim". Você está certo, a situação que eu supunha não é realista; Estou ciente disso. No entanto, a questão estava relacionada apenas à lógica que você descreveu e a finalidade era compreendê-la. Minha convicção era algo como "causalidade implica associação estatística" e outras respostas nesta página são assim. Afinal, seu exemplo é levemente irreal, mas não é por esse motivo desinteressante. Parece-me que, também em geral, a causalidade sem associação estatística é levemente irrealista, mas teoricamente interessante.
markowitz
11
@markowitz a "invisibilidade estatística" acontece quando o modelo não é fiel ao gráfico. Para o cancelamento exato, isso depende de uma escolha específica de parametrização; portanto, algumas pessoas argumentam que é realmente improvável. No entanto, o cancelamento próximo pode ser plausível, pois depende de uma vizinhança de parâmetros, portanto tudo depende do contexto. O ponto aqui é que você precisa explicitar suas suposições causais porque, logicamente, a causação não implica associação por si só - você precisa de suposições adicionais.
Carlos Cinelli
13

A causa eo efeito será correlacionado menos que não haja variação em tudo na incidência e magnitude da causa e nenhuma variação em tudo em sua força causal. A única outra possibilidade seria se a causa estivesse perfeitamente correlacionada com outra variável causal com exatamente o efeito oposto. Basicamente, essas são condições de experimento mental. No mundo real, a causação implicará dependência de alguma forma (embora possa não ser uma correlação linear ).

ung
fonte
3
@ NeilG, aceitei meu vício em itálico .
gung
11
Algumas teorias realmente implicam isso, por exemplo, muitos modelos de teoria dos jogos. Algumas situações empíricas em que você não consegue discernir a diferença (embora realmente exista uma em itálico) :-) incluem cenários de mudança de gene 'neutros' quando a pressão de seleção evolutiva em dois níveis aponta em direções diferentes.
conjugateprior
11
Eu gosto da primeira exceção, mas não da segunda. Eu gosto de pensar que apertar o botão faz com que a luz acenda, mas se eu ligar o interruptor apenas durante um blecaute, nada acontece. Talvez não houvesse realmente uma relação causal.
Emory
11
@ naught101, você levanta um bom ponto, que foi discutido em outras partes desta página. Eu editei minha resposta. No entanto, quando trabalhei com pessoas, não acho que elas tenham uma forte concepção de correlação como necessariamente linear, mesmo que eu diga a elas. Embora eles não o incluam nesses termos, acho que a maioria das pessoas entende 'correlação' como mais próxima de 'função de'. No entanto, eu deveria ser mais claro no uso de termos e deveria ter sido desde o início.
gung
2
@emory: a causa da luz acesa é realmente o fechamento do circuito elétrico (causado pelo acionamento do interruptor, com as condições ambientais, incluindo uma grade em funcionamento). Durante um blecaute, pressionar o interruptor não fecha o circuito, porque está quebrado em outro lugar. Então, de certa forma, o apagão é o efeito "oposto" de que o gung estava falando (ou seja, a luz está acesa, o apagão apaga). Também poderia ser pensado como um efeito nulo.
precisa saber é o seguinte
2

Há ótimas respostas aqui. Artem Kaznatcheev , Fomite e Peter Flom apontam que a causalidade geralmente implicaria dependência e não correlação linear. Carlos Cinelli dá um exemplo em que não há dependência, por causa de como a função de geração é configurada.

Quero acrescentar um ponto sobre como essa dependência pode desaparecer na prática, nos tipos de conjuntos de dados com os quais você pode trabalhar. Situações como o exemplo de Carlos não se limitam a meras "condições de experimento mental".

As dependências desaparecem nos processos de autorregulação . A homeostase, por exemplo, garante que a temperatura interna do corpo permaneça independente da temperatura ambiente. O calor externo influencia diretamente a temperatura do corpo, mas também influencia os sistemas de refrigeração do corpo (por exemplo, sudorese), que mantêm a temperatura do corpo estável. Se amostrarmos a temperatura em intervalos extremamente rápidos e usarmos medidas extremamente precisas, teremos a chance de observar as dependências causais, mas em taxas de amostragem normais, a temperatura corporal e a temperatura externa parecem independentes.

Processos de autorregulação são comuns em sistemas biológicos; eles são produzidos pela evolução. Mamíferos que não conseguem regular a temperatura do corpo são removidos por seleção natural. Os pesquisadores que trabalham com dados biológicos devem estar cientes de que as dependências causais podem desaparecer em seus conjuntos de dados.

Lizzie Silver
fonte
-3

Uma causa sem correlação não seria um rng?

A menos que, como a resposta aceita implique, você esteja usando uma interpretação incrivelmente limitada da palavra 'correlação', é uma pergunta boba - se uma coisa 'causa' outra, é por definição afetada por ela de alguma forma, se é uma aumento da população, ou apenas intensidade.

direito?

Então, novamente, você poderia estar discutindo algo mais parecido, a visibilidade de algo sendo afetado por outra coisa, que eu acho que pareceria causalidade, mas na verdade você não está medindo o que pensa que está medindo ...

Então, sim, acho que a resposta curta seria "Sim, desde que você não possa criar entropia".

user3363155
fonte