Seja e X variáveis aleatórias. E ( Y | X ) representa a média condicional de Y dado X . Dizemos que Y não está causalmente relacionado a X se E ( Y | X ) não depende de X , o que implica que é igual a E ( Y ) . Agora, vamos prosseguir com essa definição de causalidade por um segundo. Pela lei das expectativas iteradas, E ( X E ( Y | X ) . Isso significa que se E ( Y | X ) não depender de X , se for igual a E ( Y ) , então E ( X ) E ( Y ) = E ( X Y ) .
Em outras palavras:
Se e Y não estiverem relacionados causalmente, X e Y não serão correlacionados! - Isso não faz sentido e eu sei que isso deve estar errado. Eu defini causalidade incorretamente? O que eu fiz errado?
Em econometrics que assumem geralmente . Então E ( Y | X ) = E ( Y ) é equivalente a b 1 = 0 . A lógica também se aplica nesse cenário específico.
Respostas:
Você definiu causalidade incorretamente, sim. Provavelmente, você já ouviu o ditado "correlação não é causalidade". Você definiu essencialmente causalidade como correlação. O problema é pior que isso, no entanto. Causalidade não é um conceito estatístico ou probabilístico, pelo menos como esses tópicos são normalmente ensinados. Não há definição estatística ou probabilística de causalidade: nada que envolva expectativas condicionais ou distribuições condicionais ou algo semelhante. É difícil perceber esse fato em cursos de estatística ou econometria.
Infelizmente, tendemos a fazer um trabalho melhor dizendo o que não é causalidade do que o que é causalidade. A causalidade sempre e em toda parte vem da teoria, de um raciocínio a priori, de suposições. Você mencionou econometria. Se você aprendeu as variáveis instrumentais com competência, sabe que os efeitos causais só podem ser medidos se você tiver uma "restrição de exclusão". E você sabe que as restrições de exclusão sempre vêm da teoria.
Você disse que queria matemática, no entanto. O cara que você quer ler é Judea Pearl . Não é uma matemática fácil, e a matemática às vezes se desvia para a filosofia, mas é porque a causalidade é um assunto difícil. Aqui está uma página com mais links sobre o assunto. Aqui está um livro on-line gratuito que me deparei. Finalmente, aqui está uma pergunta anterior em que eu dei uma resposta que você pode achar útil.
fonte
Isto está errado. Relações causais são sobre dependências funcionais / estruturais, não dependências estatísticas / associativas. Você deveria dar uma olhada aqui.
Sim, você o definiu incorretamente, pode verificar os livros / referências de inferência causal aqui . Mais formalmente, em um modelo de equações estruturais, o efeito causal de na distribuição de Y , que podemos denotar por P ( Y | d o ( X = x ) ) --- isto é, como a mudança de X afeta a distribuição de Y --- é matematicamente definida como a distribuição de probabilidade induzida pelo modelo de equação estrutural modificado, em que a equação para X é substituída por X = x .X Y P( Y| do ( X= x ) ) X Y X X= x
Por exemplo, suponha que seu modelo causal seja definido pelas seguintes equações estruturais:
Onde os distúrbios são mutuamente independentes e têm alguma distribuição de probabilidade. Isso corresponde ao DAG:
Então é a distribuição de probabilidade de Y induzida pelas equações estruturais modificadas:P(Y|do(X=x)) Y
O que corresponde ao DAG mutilado:
O efeito causal médio seria simplesmente a expectativa de usando o cdf causal P ( Y | d o ( X = x ) ) .Y P(Y|do(X=x))
Esta é a definição matemática, se você pode identificar o efeito com dados observacionais depende se você pode re-expressar em termos da distribuição observacional sem o operador d o ( ) .P(Y|do(X=x)) do()
fonte
Um contra-exemplo
Um exemplo de uma maneira formal de pensar sobre causalidade
fonte
No entanto, não vejo onde está o seu problema?
Exemplo: considere a seguinte tabela:
É fácil ver queE(Y)=E(X)=E(X⋅Y)=0 E(Y|X=−1)=E(Y|X=1)=0 E(Y|X)=E(X)
fonte