Nenhuma correlação não implica causalidade?

73

Eu sei que correlação não implica causalidade, mas uma ausência de correlação implica ausência de causalidade?

user2088176
fonte
46
Para citar Andrew Gelman, "Correlação nem implica correlação".
11555 Mike
9
Não. A pode ser a causa de B, mas apenas a afeta de maneira não linear.
Neil G
3
"Correlação se correlaciona com causalidade. (Apenas não muito.)"
Adrian
7
Por favor, olhe esta página para o contrapositivo. Se a causalidade não implica correlação, então nenhuma correlação não implica causalidade.
EdM
4
Embora seja um bom começo para sinalizar que a correlação não implica causalidade e, em seguida, discutir detalhes, há muito tempo penso por que destacar uma correlação? Eu atribuo isso à assonância, e à idéia atraente para os professores (eu também) de que os alunos com algum esforço podem se lembrar de um slogan e usá-lo em seus pensamentos. Mas a verdade é que pouco em estatística implica causalidade. Em outras palavras, esse aviso geralmente vem no capítulo de correlação ou na palestra de correlação, mas pertence a todos os lugares.
Nick #

Respostas:

76

uma ausência de correlação implica ausência de causalidade?

Não. Qualquer sistema controlado é um contra-exemplo.

Sem relações causais, o controle é claramente impossível, mas o controle bem-sucedido significa - grosso modo - que alguma quantidade está sendo mantida constante, o que implica que ela não será correlacionada com nada, incluindo o que quer que as coisas estejam fazendo com que seja constante.

Portanto, nessa situação, não seria possível concluir nenhuma relação causal por falta de correlação.

Aqui está um exemplo um pouco atual .

conjugado
fonte
Uma forma intuitiva para pensar nisso
Repmat
+1, tomada interessante. No entanto, parece implicar que a causa possa estar presente enquanto a correlação de qualquer tipo estiver ausente. Isso não pode ser verdade. Se algum evento faz com que outro haverá algum" tipo de correlação presente, tht _constant que você mencionou será na forma de correlação não-linear
Aksakal
11
+1 Bra vo! Quando vi o título da pergunta na barra lateral, fiquei com toda a pergunta "Isso precisa ser respondido da perspectiva dos sistemas". Você acertou em cheio.
Alexis5
Se, a partir de uma ausência de correlação, se remove a causalidade, o funcionamento restante será candidato a rotular "casualidade"?
precisa saber é o seguinte
11
Não sei se estou entendendo a pergunta de @ttnphns, mas acho que a resposta é: se você apertar o cabo do freio (ou desconectar o pedal do acelerador), as colinas começarão a mostrar seu impacto causal na velocidade de um carro.
conjugateprior
30

Não. Principalmente porque por correlação você provavelmente quer dizer correlação linear . Duas variáveis ​​podem ser correlacionadas não linearmente e podem não mostrar correlação linear . É fácil construir um exemplo como esse, mas vou dar um exemplo mais próximo da sua pergunta (mais restrita).

Vejamos a variável aleatória , e a função não aleatória f ( x ) = x 2 , com a qual criamos uma variável aleatória y = f ( x ) . A última é claramente causada pela variável anterior, não apenas correlacionada. Vamos desenhar um gráfico de dispersão:xf(x)=x2y=f(x)

insira a descrição da imagem aqui

Imagem de correlação não linear agradável e clara , mas neste caso também é causalidade direta. No entanto, o coeficiente de correlação linear não é significativo, ou seja, não há correlação linear, apesar da correlação não linear óbvia e até da causalidade:

>> x=randn(100,1);
>> y=x.^2;
>> scatter(x,y)
>> [rho,pval]=corr(x,y)

rho =

    0.0140


pval =

    0.8904

x

E[x]=0
E[x2]=1
E[xx2]=E[x3]=0
Cov[x,x2]=E[xx2]E[x]E[x2]=0

U[1,1]

Aksakal
fonte
8
A não significância não implica a verdade da hipótese nula. O que é importante no seu exemplo é que o coeficiente de correlação populacional é 0.
Kodiologist
11
Por que você acredita que o OP significa correlação linear?
precisa saber é o seguinte
@immibis, porque a causação deve resultar em algum tipo de correlação não linear.
Aksakal
E[X3]E[X2]E[X]XE[X3]E[X2]E[X]X
x
18

Não . Em particular, variáveis ​​aleatórias podem ser dependentes, mas não correlacionadas.

x[1,1]YxxxYX[1,1]Yx=X(X,Y)XY

P(X<12)P(|Y|<12)=1412=180=P(X<12,|Y|<12).

XY

Corr(X,Y)=Cov(X,Y)σXσY=E[XY]E[X]E[Y]σXσY=000σXσY=0.
Kodiologist
fonte
11
Na verdade, este é um mau exemplo na minha opinião. X não causa Y. Uma variável binária ausente do modelo PresenceOfX é a causa real com uma correlação de 1. O que você prova é que o valor de X não influencia Y.
user2088176
6
Estou realmente em uma perda de como você podia sentir que a escolha de não causa . Talvez você deva especificar o que você quer dizer com "causa". xY
Kodiologist
5
@ user2088176 Aqui está uma prova rápida que a escolha de provoca . Vamos utilizar um modelo contrafático de causalidade, na qual é um índice para um conjunto de possíveis distribuições para . Se , é ou com igual probabilidade. Se , é ou com igual probabilidade. Como contrafatuais distinguidos pelo valor de implicam distribuições distintas para , a escolha de causaxYxYx=12Y1212x=34Y -334 xYxY34xYxY .
Kodiologist
11
Este exemplo talvez seja mais simples (e ainda funcione) se limitarmos a . [ 0 , 1 ]x[0,1]
JiK 04/07
3
E o exemplo simples e padrão: e . Eles não estão correlacionados, mas o -distributed é perfeitamente dependente . X 2 χ 2 ( 1 ) X 2 XXN(0,1)X2χ2(1)X2X
Therkel
14

Talvez analisá-lo de uma perspectiva computacional ajude.

Como um exemplo concreto, use um gerador de números pseudo-aleatórios.

Existe uma relação causal entre a semente que você definiu e a saída do gerador?kth

Existe alguma correlação mensurável?

Szabolcs
fonte
7

A melhor resposta para a pergunta é que a correlação é uma relação estatística, matemática e / ou física, enquanto a causação é uma relação metafísica. Você não pode logicamente passar da correlação (ou não-correlação) para a causalidade, sem um conjunto (grande) de suposições que vinculam a metafísica à física. (Um exemplo é que o que duas pessoas podem concordar em ser "um observador racional" é em grande parte arbitrário e provavelmente ambíguo). Se A paga B para fazer C que resulta em D, qual é a causa de D? Simplesmente não há razão racional para escolher C ou B ou A (ou qualquer um dos eventos precursores de A). A teoria do controle lida com sistemas em reinos onde eles estão sob controle. Uma maneira de controlar uma variável dependente é reduzir a resposta dessa variável ao possível intervalo de variação (controlada) da variável independente ao ruído estatístico. Por exemplo, sabemos que a pressão do ar se correlaciona com a saúde (apenas tente respirar o vácuo), mas se controlarmos a pressão do ar para 1 +/- 0,001 atm, qual a probabilidade de QUALQUER variação da pressão do ar afetar a saúde?

Li Zhi
fonte
A distinção que você procura é 'observada em uma amostra' (correlação) versus dependência que existe, seja ou não observada em uma amostra (física). Não há papel para a metafísica nesta explicação (embora alguns sejam para suposição física). As molas têm limites elásticos, independentemente de nunca chegarem a elas. Ou, em um exemplo mais simples: um cubo de açúcar é solúvel - um conceito claramente causal que implica, grosso modo, que se você o deixar cair no chá, ele se dissolverá. Mas essa propriedade causal é puramente devida à sua estrutura física . Cubos de açúcar seriam solúveis, mesmo que nunca pensássemos dissolver nenhum deles.
conjugateprior
11
Você está certo, é claro, que sem suposições causais em uma discussão, você não tira conclusões causais disso. Mas não há realmente nada de muito metafísico nisso!
conjugateprior
fwiw, a teoria contrafactual da causalidade (por exemplo, Pearl ou Woodward) é exatamente projetada para dar sentido a "Se A paga B para fazer C que resulta em D, qual é a causa de D? Simplesmente não há razão racional para escolher C, B ou A" . A única noção antiquada e inútil que essas teorias colocam para descansar é que sempre podemos fazer sentido da idéia de que há a causa de alguma coisa. Claro que não existe.
conjugateprior
5

Sim , ao contrário das respostas anteriores. Vou considerar a questão como não técnica, particularmente a definição de "correlação". Talvez eu esteja usando muito amplamente, mas veja minha segunda bala. Espero que seja considerado apropriado discutir outras respostas aqui, porque elas iluminam diferentes partes da pergunta. Estou me baseando na abordagem de Pearl à causalidade e, em particular, na minha opinião em alguns artigos com Kevin Korb. Woodward provavelmente tem a conta não técnica mais clara.

  • xyxyxyyxy

  • y=x2yxxyxy

  • y=Unif(x,x)|y|=|x|

  • π

  • ABCDAD mas a correlação existe porque existe uma história causal.

Não sei o que o @ user2088176 tinha em mente, mas acho que se fizermos a pergunta de maneira muito geral, a resposta será sim. Pelo menos acho que essa é a resposta exigida da literatura sobre descoberta causal e o relato intervencionista da causação. Causas são diferenças que fazem a diferença. E essa diferença será revelada, em alguns experimentos, como associação persistente.

ctwardy
fonte
11
Eu esperava abordar isso de uma perspectiva mais simples e não técnica, como você tem. O que significa "causa"? Presumivelmente, envolve mudança em algo que leva a uma mudança em outra coisa. Não consigo entender a causalidade sem algum tipo de correlação.
Behacad
11
@ Behacad Acho que o contraste está entre algum tipo de correlação (o tipo de coisa que você pode observar) e algum tipo de dependência (que pode nunca ser desencadeada). Existem dependências não disparadas, mas não há correlações não observadas. É por isso que a causação tem um elemento contrafactual em sua definição, enquanto a correlação não.
conjugateprior