Quais abordagens teóricas da causalidade eu devo conhecer como estatístico / economista aplicado?
Eu sei o (um pouquinho)
- Modelo causal de Neyman – Rubin (e Roy , Haavelmo etc.)
- O trabalho de Pearl sobre causalidade
- Causalidade de Granger (embora menos orientada para o tratamento)
De quais conceitos sinto falta ou devo estar ciente?
Relacionado: Quais teorias são os fundamentos da causalidade no aprendizado de máquina?
Li estas perguntas e respostas interessantes ( 1 , 2 , 3 ), mas acho que é uma pergunta diferente. E fiquei muito surpreso ao ver que "causalidade", por exemplo, não é mencionada em Elementos de Aprendizagem Estatística .
machine-learning
causality
theory
treatment-effect
Arne Jonas Warnke
fonte
fonte
Respostas:
Embora seja quase incontroverso que uma causa preceda seu efeito no tempo, para tirar conclusões causais com precedência no tempo, você ainda precisa alegar ausência de confusão, entre outras fontes de associações espúrias.
Agora, com relação aos Resultados Potenciais (Neyman-Rubin) versus Gráficos Causais / Modelagem de Equações Estruturais (Pearl), eu diria que este é um dilema falso e você deve aprender os dois.
Primeiro, é importante notar que essas não são visões opostas sobre causalidade . Como Pearl coloca, há uma hierarquia em relação às tarefas de inferência (causal):
Para a primeira tarefa, você só precisa conhecer a distribuição conjunta das variáveis observadas. Para a segunda tarefa, você precisa conhecer a distribuição conjunta e a estrutura causal. Para a última tarefa, de contrafactuais, você precisará ainda de algumas informações sobre as formas funcionais do seu modelo de equações estruturais.
Então, quando se fala em contrafatuais, há uma equivalência formal entre as duas perspectivas . A diferença é que os resultados em potencial tomam declarações contrafactuais como primitivas e, nos DAGs, os contrafatuais parecem derivar das equações estruturais. No entanto, você pode perguntar, se eles são "equivalentes", por que se preocupar em aprender os dois? Porque existem diferenças em termos de "facilidade" para expressar e derivar coisas.
Por exemplo, tente expressar o conceito de viés M usando apenas resultados em potencial - nunca vi um bom. De fato, minha experiência até agora é que os pesquisadores que nunca estudaram gráficos nem sequer estão cientes disso. Além disso, lançar as suposições substantivas do seu modelo em linguagem gráfica facilitará computacionalmente a derivação de suas implicações empíricas testáveis e a resposta a perguntas de identificabilidade. Por outro lado, às vezes as pessoas acham mais fácil pensar primeiro diretamente nos contrafatuais e combinam isso com suposições paramétricas para responder a perguntas muito específicas.
Há muito mais a dizer, mas o ponto aqui é que você deve aprender a "falar os dois idiomas". Para referências, você pode conferir como começar aqui.
fonte