Que teorias de causalidade devo saber?

16

Quais abordagens teóricas da causalidade eu devo conhecer como estatístico / economista aplicado?

Eu sei o (um pouquinho)

De quais conceitos sinto falta ou devo estar ciente?

Relacionado: Quais teorias são os fundamentos da causalidade no aprendizado de máquina?

Li estas perguntas e respostas interessantes ( 1 , 2 , 3 ), mas acho que é uma pergunta diferente. E fiquei muito surpreso ao ver que "causalidade", por exemplo, não é mencionada em Elementos de Aprendizagem Estatística .

Arne Jonas Warnke
fonte
2
Confira a revisão de Andrew Gelman de vários trabalhos sobre causalidade em AJS: Gelman, A. (2011). Causalidade e aprendizagem estatística. American Journal of Sociology, 117 (3), 955-966. doi: 10.1086 / 662659 . É uma breve visão geral da causalidade nas ciências sociais, com referências específicas às obras de Rubin e Pearl, além de outras. Um bom lugar para vasculhar as referências.
paqmo
1
Para começar, os métodos de (John Stuart) Mill. en.wikipedia.org/wiki/Mill's_Methods
noumenal
Veja meu comentário na resposta aceita sobre uma possível má interpretação da causalidade de Granger.
Richard Hardy

Respostas:

17

B

Embora seja quase incontroverso que uma causa preceda seu efeito no tempo, para tirar conclusões causais com precedência no tempo, você ainda precisa alegar ausência de confusão, entre outras fontes de associações espúrias.

Agora, com relação aos Resultados Potenciais (Neyman-Rubin) versus Gráficos Causais / Modelagem de Equações Estruturais (Pearl), eu diria que este é um dilema falso e você deve aprender os dois.

Primeiro, é importante notar que essas não são visões opostas sobre causalidade . Como Pearl coloca, há uma hierarquia em relação às tarefas de inferência (causal):

  1. Previsão observacional
  2. Previsão sob intervenção
  3. Contrafatuais

Para a primeira tarefa, você só precisa conhecer a distribuição conjunta das variáveis ​​observadas. Para a segunda tarefa, você precisa conhecer a distribuição conjunta e a estrutura causal. Para a última tarefa, de contrafactuais, você precisará ainda de algumas informações sobre as formas funcionais do seu modelo de equações estruturais.

Então, quando se fala em contrafatuais, há uma equivalência formal entre as duas perspectivas . A diferença é que os resultados em potencial tomam declarações contrafactuais como primitivas e, nos DAGs, os contrafatuais parecem derivar das equações estruturais. No entanto, você pode perguntar, se eles são "equivalentes", por que se preocupar em aprender os dois? Porque existem diferenças em termos de "facilidade" para expressar e derivar coisas.

Por exemplo, tente expressar o conceito de viés M usando apenas resultados em potencial - nunca vi um bom. De fato, minha experiência até agora é que os pesquisadores que nunca estudaram gráficos nem sequer estão cientes disso. Além disso, lançar as suposições substantivas do seu modelo em linguagem gráfica facilitará computacionalmente a derivação de suas implicações empíricas testáveis ​​e a resposta a perguntas de identificabilidade. Por outro lado, às vezes as pessoas acham mais fácil pensar primeiro diretamente nos contrafatuais e combinam isso com suposições paramétricas para responder a perguntas muito específicas.

Há muito mais a dizer, mas o ponto aqui é que você deve aprender a "falar os dois idiomas". Para referências, você pode conferir como começar aqui.

Carlos Cinelli
fonte
1
Você poderia fornecer um exemplo de algo fácil de expressar em termos de OPs, mas não em DAGs?
Guilherme Duarte
Quantidades de mediação @GuilhermeDuarte envolvendo counterfactuals aninhados por exemplo
Carlos Cinelli
3
UMAGrumangerBUMABB
@RichardHardy Acho que você está certo, talvez um galo perfeito que cante sempre uma hora antes do nascer do sol possa ter algum poder preditivo além de um modelo linear de série temporal do nascer do sol (já que o nascer do sol não é exatamente o mesmo todos os dias), mas com um modelo perfeito provavelmente não adiciona nada.
Carlos Cinelli
Penso que a causalidade de Granger não sugere o uso de modelos preditivos inferiores apenas com o histórico de B para justificar a necessidade de uma variável adicional A e, portanto, a causalidade de Granger. Em vez disso, o ideal seria procurar um modelo o melhor possível, usando a própria história de B e ver se a adição de A (de alguma forma) ajuda a prever B. E, é claro, "um galo perfeito" é um conceito bastante utópico. Diante disso, acho que editar a resposta para refletir isso pode ser uma boa ideia.
9788 Richard Hardy