Qual é a definição matemática de uma relação causal entre duas variáveis aleatórias?
Dada uma amostra da distribuição conjunta de duas variáveis aleatórias e , quando diríamos que causa ?
Para contextualizar, estou lendo este artigo sobre descoberta causal .
Respostas:
Matematicamente, um modelo causal consiste em relacionamentos funcionais entre variáveis. Por exemplo, considere o sistema de equações estruturais abaixo:
Isso significa quex determina funcionalmente o valor de y (se você intervir em x isso altera os valores de y ), mas não o contrário. Graficamente, isso geralmente é representado por x→y , o que significa que x entra na equação estrutural de y. Como adendo, você também pode expressar um modelo causal em termos de distribuições conjuntas de variáveis contrafactuais, matematicamente equivalentes a modelos funcionais .
Às vezes (ou na maioria das vezes) você não tem conhecimento sobre a forma das equações estruturaisfx , fy , nem mesmo se x→y ou y→x . A única informação que você tem é a distribuição de probabilidade conjunta p(y,x) (ou amostras dessa distribuição).
Isso leva à sua pergunta: quando posso recuperar a direção da causalidade apenas a partir dos dados? Ou, mais precisamente, quando posso recuperar sex entra na equação estrutural de y ou vice-versa, apenas a partir dos dados?
Obviamente, sem suposições fundamentalmente não testáveis sobre o modelo causal, isso é impossível . O problema é que vários modelos causais diferentes podem implicar a mesma distribuição de probabilidade conjunta das variáveis observadas. O exemplo mais comum é um sistema linear causal com ruído gaussiano.
Mas, sob algumas suposições causais, isso pode ser possível - e é nisso que a literatura de descoberta causal trabalha. Se você não tem exposição prévia a esse tópico, pode começar com Elements of Causal Inference de Peters, Janzing e Scholkopf, bem como no capítulo 2 de Causality de Judea Pearl. Temos um tópico aqui no CV para referências sobre descoberta causal , mas ainda não temos muitas referências listadas lá.
Portanto, não há apenas uma resposta para sua pergunta, pois depende das suposições feitas. O artigo que você menciona cita alguns exemplos, como assumir um modelo linear com ruído não gaussiano . Este caso é conhecido como LINGAN (abreviação de modelo acíclico não gaussiano linear), aqui está um exemplo em
R
:Observe aqui que temos um modelo causal linear com ruído não gaussiano, em quex2 causa x1 e lingam recupera corretamente a direção causal. No entanto, observe que isso depende criticamente das suposições da LINGAM.
No caso do artigo que você cita, eles fazem essa suposição específica (veja o "postulado"):
Sex→y , o comprimento mínimo da descrição do mecanismo de mapeamento de X para Y é independente do valor de X, enquanto o comprimento mínimo da descrição do mecanismo de mapeamento de Y para X depende do valor de Y.
Observe que isso é uma suposição. Isso é o que chamaríamos de "condição de identificação". Essencialmente, o postulado impõe restrições à distribuição conjuntap(x,y) . Ou seja, o postulado diz que se x→y certas restrições se mantêm nos dados e se y→x outras restrições se mantêm. Esses tipos de restrições que têm implicações testáveis (impõem restrições a p(y,x) ) é o que permite a recuperação direcional de dados observacionais.
Como observação final, os resultados da descoberta causal ainda são muito limitados e, dependendo de fortes suposições, tome cuidado ao aplicá-los no contexto do mundo real.
fonte
lm
). Não podemos todos contornar as amostras observacionais dos conjuntos de dados Tuebingen para ter uma idéia da descoberta causal! :)Há uma variedade de abordagens para formalizar a causalidade (que está de acordo com uma discordância filosófica substancial sobre a causalidade que existe há séculos). Um popular é em termos de resultados potenciais. A abordagem dos resultados potenciais, chamada modelo causal de Rubin , supõe que, para cada estado causal, haja uma variável aleatória diferente. Portanto,Y1 pode ser a variável aleatória de possíveis resultados de um ensaio clínico se um indivíduo tomar o medicamento do estudo e Y2 pode ser a variável aleatória se ele tomar o placebo. O efeito causal é a diferença entre Y1 e Y2 . Se de fato Y1=Y2 , poderíamos dizer que o tratamento não tem efeito. Caso contrário, poderíamos dizer que a condição de tratamento causa o resultado.
As relações causais entre variáveis também podem ser representadas com gráficos acílicos direcionais , que têm um sabor muito diferente, mas acabam sendo matematicamente equivalentes ao modelo de Rubin (Wasserman, 2004, seção 17.8).
Wasserman, L. (2004). Todas as estatísticas: um curso conciso de inferência estatística . Nova York, NY: Springer. ISBN 978-0-387-40272-7.
fonte
Uma intervenção é uma alteração cirúrgica em uma variável que não afeta as variáveis das quais depende. As intervenções foram formalizadas rigorosamente em equações estruturais e modelos gráficos causais, mas, tanto quanto eu sei, não existe uma definição que seja independente de uma determinada classe de modelo.
Nas abordagens modernas de causalidade, a intervenção é tomada como o objeto primitivo que define as relações causais (definição 1). Na minha opinião, no entanto, a intervenção é um reflexo e necessariamente consistente com a dinâmica da simulação.
fonte