Definição matemática de causalidade

9

Seja e X variáveis ​​aleatórias. E ( Y | X ) representa a média condicional de Y dado X . Dizemos que Y não está causalmente relacionado a X se E ( Y | X ) não depende de X , o que implica que é igual a E ( Y ) . Agora, vamos prosseguir com essa definição de causalidade por um segundo. Pela lei das expectativas iteradas, E ( X E ( Y | X )YXE(Y|X)YXYXE(Y|X)XE(Y) . Isso significa que se E ( Y | X ) não depender de X , se for igual a E ( Y ) , então E ( X ) E ( Y ) = E ( X Y ) .E(XE(Y|X))=E(E(XY|X))=E(XY)E(Y|X)XE(Y)E(X)E(Y)=E(XY)

Em outras palavras:

Se e Y não estiverem relacionados causalmente, X e Y não serão correlacionados! - Isso não faz sentido e eu sei que isso deve estar errado. Eu defini causalidade incorretamente? O que eu fiz errado?XYXY

Em econometrics que assumem geralmente . Então E ( Y | X ) = E ( Y ) é equivalente a b 1 = 0 . A lógica também se aplica nesse cenário específico.E(Y|X)=b0+b1XE(Y|X)=E(Y)b1=0

cristão
fonte
2
Você disse que . Eu acredito que isso é errado. E (Y | X) é uma constante. Portanto, E ( X E ( Y | X ) ) é igual a E ( Y | X ) E ( X ) . Outro ponto, E ( YE(XE(Y|X))=E(E(XY|X))=E(XY)E(XE(Y|X))E(Y|X)E(X) vem do modelo de regressão linear simples. E(Y|X)=b0+b1X
Budhapest
Seja E (Y | X) = b, onde b é uma constante. Então tome expectativas de ambos os lados. Verifica-se que E (E (Y | X)) = E (b) = b. Pela lei das expectativas iteradas, E (E (Y | X)) = E (Y). Portanto, se E (Y | X) for constante, ele deverá ser igual a E (Y).
Christian
Se E (Y / X) = b, isso implica que Y não depende de X e E (Y) = b, você está se confundindo.
SAAN 12/09
Não entendo por que "isso não faz sentido". Você está começando com uma definição de causalidade que eu acho equivalente à definição de independência nas estatísticas. E variáveis ​​independentes têm covariância zero, onde está a história?
janeiro
Janeiro, não, eles não são a mesma coisa! X e Y são independentes se a distribuição conjunta fatorar no produto dos marginais, e isso definitivamente não é a mesma coisa. Não vejo qual é o seu ponto? Azeem, além de repetir o que eu disse anteriormente, você tem algo a contribuir? Em vez de dizer que estou errado, você pode explicar por que estou errado?
Christian

Respostas:

18

Você definiu causalidade incorretamente, sim. Provavelmente, você já ouviu o ditado "correlação não é causalidade". Você definiu essencialmente causalidade como correlação. O problema é pior que isso, no entanto. Causalidade não é um conceito estatístico ou probabilístico, pelo menos como esses tópicos são normalmente ensinados. Não há definição estatística ou probabilística de causalidade: nada que envolva expectativas condicionais ou distribuições condicionais ou algo semelhante. É difícil perceber esse fato em cursos de estatística ou econometria.

Infelizmente, tendemos a fazer um trabalho melhor dizendo o que não é causalidade do que o que é causalidade. A causalidade sempre e em toda parte vem da teoria, de um raciocínio a priori, de suposições. Você mencionou econometria. Se você aprendeu as variáveis ​​instrumentais com competência, sabe que os efeitos causais só podem ser medidos se você tiver uma "restrição de exclusão". E você sabe que as restrições de exclusão sempre vêm da teoria.

Você disse que queria matemática, no entanto. O cara que você quer ler é Judea Pearl . Não é uma matemática fácil, e a matemática às vezes se desvia para a filosofia, mas é porque a causalidade é um assunto difícil. Aqui está uma página com mais links sobre o assunto. Aqui está um livro on-line gratuito que me deparei. Finalmente, aqui está uma pergunta anterior em que eu dei uma resposta que você pode achar útil.

Conta
fonte
Agradeço-vos sinceramente. Vou ler o trabalho dele e voltar para você quando tiver tempo.
Christian
4
Excelente resposta. O livro Morgan & Winship é um pouco mais fácil que Pearl, com foco em problemas de ciências sociais.
Dimitriy V. Masterov
8

Dizemos que não está causalmente relacionado a X se E ( Y | X ) não depende de X , o que implica que é igual a E ( Y ) .YXE(Y|X)XE(Y)

Isto está errado. Relações causais são sobre dependências funcionais / estruturais, não dependências estatísticas / associativas. Você deveria dar uma olhada aqui.

Eu defini causalidade incorretamente? O que eu fiz errado?

Sim, você o definiu incorretamente, pode verificar os livros / referências de inferência causal aqui . Mais formalmente, em um modelo de equações estruturais, o efeito causal de na distribuição de Y , que podemos denotar por P ( Y | d o ( X = x ) ) --- isto é, como a mudança de X afeta a distribuição de Y --- é matematicamente definida como a distribuição de probabilidade induzida pelo modelo de equação estrutural modificado, em que a equação para X é substituída por X = x .XYP(Y|do(X=x))XYXX=x

Por exemplo, suponha que seu modelo causal seja definido pelas seguintes equações estruturais:

U=ϵuX=f(U,ϵx)Y=g(X,U,ϵy)

Onde os distúrbios são mutuamente independentes e têm alguma distribuição de probabilidade. Isso corresponde ao DAG:

insira a descrição da imagem aqui

Então é a distribuição de probabilidade de Y induzida pelas equações estruturais modificadas:P(Y|do(X=x))Y

U=ϵuX=xY=g(X,U,ϵy)

O que corresponde ao DAG mutilado:

insira a descrição da imagem aqui

O efeito causal médio seria simplesmente a expectativa de usando o cdf causal P ( Y | d o ( X = x ) ) .YP(Y|do(X=x))

E[Y|do(X=x)]=YdP(Y|do(X=x))

Esta é a definição matemática, se você pode identificar o efeito com dados observacionais depende se você pode re-expressar em termos da distribuição observacional sem o operador d o ( ) .P(Y|do(X=x))do()

Carlos Cinelli
fonte
3

Um contra-exemplo

E[Y|X]=E[Y]YXXY

Y=WXXWW=111/2E[Y|X]=E[Y]YX

Um exemplo de uma maneira formal de pensar sobre causalidade

YiiDi{0,1}

E[Yi|Di=1]E[Yi|Di=0].

Potential Outcome={Y1,iif Di=1Y0,iif Di=0.
Y0,iiY1,i
Yi={Y1,iif Di=1Y0,iif Di=0.
Yi=Y0,i+(Y1,iY0,i)DiY1,iY0,i E[Y
E[Yi|Di=1]E[Yi|Di=0]=E[Y1,i|Di=1]E[Y0,i|Di=1]+E[Y0,i|Di=1]E[Y0,i|Di=0].
E[Y1,i|Di=1]E[Y0,i|Di=1]E[Y0,i|Di=1]E[Y0,i|Di=0]Di
E[Yi|Di=1]E[Yi|Di=0]=E[Y1,i|Di]E[Y0,i|Di=0]=E[Y1,i|Di]E[Y0,i|Di=1]=E[Y1,iY0,i|Di=1]=E[Y1,iY0,i],
E[Y1,iY0,i]
jmbejara
fonte
1

E()E(Y|X)=E(Y)E(XY)=E(X)E(Y)

No entanto, não vejo onde está o seu problema?

  1. XY
  2. XY

Exemplo: considere a seguinte tabela:

     Y
 X | -1      0      1
 --+---------------------
-1 | 0.25    0     0.25
 1 |   0    0.5      0

P(X=1Y=0)=0.5

É fácil ver que E(Y)=E(X)=E(XY)=0E(Y|X=1)=E(Y|X=1)=0E(Y|X)=E(X)

E(XY)=E(X)E(Y)

P(X=1Y=0)=0.50.50.5=P(X=1)P(Y=0)

janeiro
fonte