Representando efeitos de interação em gráficos acíclicos direcionados

17

Os gráficos acíclicos direcionados (DAGs; por exemplo, Groenlândia, et al., 1999) fazem parte de um formalismo de inferência causal a partir da interpretação contrafactual do campo de causalidade. Nesses gráficos, a presença de uma seta da variável A para a variável B afirma que a variável A causa diretamente (alguma mudança no risco de) variável B , e a ausência de uma seta afirma que a variável A não causa diretamente (alguma mudança no risco de) variável B .

Como exemplo, a declaração "exposição à fumaça do tabaco causa diretamente uma alteração no risco de mesotelioma" é representada pela seta preta de "exposição à fumaça do tabaco" para "mesotelioma" no diagrama não causal do DAG abaixo.

Da mesma forma, a declaração "exposição ao amianto causa diretamente uma alteração no risco de mesotelioma" é representada pela seta preta de "exposição ao amianto" para "mesotelioma" no gráfico não causal do DAG abaixo.

Uso o termo não um DAG para descrever o gráfico causal abaixo, devido à seta vermelha, que pretendo afirmar algo como "a exposição ao amianto causa uma mudança no efeito causal direto da exposição à fumaça do tabaco sobre o risco de mesotelioma" (o amianto não dano às células do pulmão que, além de causar diretamente uma alteração no risco de mesotelioma, também torna as células mais suscetíveis aos danos cancerígenos da exposição à fumaça do tabaco, com o resultado de que a exposição ao amianto e ao tabaco resulta em um aumento na risco superior à soma dos dois riscos separados), e isso não se encaixa perfeitamente no significado formal das setas causais nos DAGs que descrevi no início da minha pergunta (ou seja, porque a seta vermelha não termina em uma variável)

Não é um gráfico acíclico direcionado: a exposição à fumaça do tabaco causa maior risco de mesotelioma;  exposição ao amianto causa aumento do risco de mesotelioma;  a exposição ao amianto causa um aumento no efeito causal do tabaco no risco de mesotelioma.

Como alguém representa corretamente os efeitos de interação dentro do formalismo visual de um DAG?

Referências

Greenland, S., Pearl, J. e Robins, JM (1999). Diagramas causais para pesquisa epidemiológica . Epidemiology , 10 (1): 37–48.

Alexis
fonte
É possível alterar o DAG adicionando um nó para danos às células pulmonares com setas do tabaco e amianto apontadas para dentro e uma seta para fora do mesotelioma? Isso mantém o DAG e fornece flexibilidade para modelar os efeitos individuais e compostos.
John Woolf
Sim, eu tinha pensado em algo assim, mas me pergunto se isso também implica que o principal efeito do tabaco não é também 'dano às células pulmonares', quando é. Suponho que alguém possa adicionar outra variável 'tabaco e amianto' causada pelo tabaco e pelo amianto, mas isso parece desajeitado ... mas talvez seja com isso que devemos concordar.
Alexis23
Qual software você usou para criar o gráfico?
zipzapboing
O @zipzapboing desenhou à mão no MS Word, ou PageStream ou Scribus ou algo assim, depois editado para cores e transparência usando o GIMP. (É realmente um trecho de alguns dos meus slides das aulas.)
Alexis

Respostas:

8

A teoria da causalidade de Pearl é completamente não paramétrica . As interações não são explicitadas por causa disso, nem no gráfico nem nas equações estruturais que ele representa. No entanto, os efeitos causais podem variar (amplamente) por suposição.

Se um efeito é identificado e você o estima com dados não parametricamente, você obtém uma distribuição completa dos efeitos causais (em vez de, digamos, um único parâmetro). Assim, você pode avaliar o efeito causal da exposição ao tabaco condicional à exposição ao amianto de maneira não paramétrica para verificar se ela muda, sem comprometer-se com nenhuma forma funcional.

Vamos dar uma olhada nas equações estruturais no seu caso, que correspondem ao seu "DAG" despido da seta vermelha:

Mesotelioma = (Tabaco, Amianto, ϵ m )f1ϵm

Tabaco = ( ϵ t )f2ϵt

Amianto = ( ϵ a )f3ϵa

onde é considerado independente por falta de setas tracejadas entre eles.ϵ

Deixamos as respectivas funções f () e as distribuições dos erros não especificadas, exceto por dizer que as últimas são independentes. No entanto, podemos aplicar a teoria de Pearl e declarar imediatamente que os efeitos causais da exposição ao tabaco e ao amianto no mesotelioma são identificados . Isso significa que, se tivéssemos infinitas observações a partir desse processo, poderíamos medir exatamente o efeito de definir as exposições para diferentes níveis simplesmente vendo as incidências de mesotelioma em indivíduos com diferentes níveis de exposição. Portanto, poderíamos inferir causalidade sem fazer um experimento real. Isso ocorre porque não existem caminhos de porta traseira das variáveis ​​de exposição para a variável de resultado.

Então você receberia

P (mesotelioma | do (tabaco = t)) = P (mesotelioma | tabaco = t)

A mesma lógica vale para o efeito causal do amianto, que permite avaliar simplesmente:

P (mesotelioma | Tabaco = t, amianto = a) - P (mesotelioma | Tabaco = t ', amianto = a)

em comparação a

P (mesotelioma | Tabaco = t, amianto = a ') - P (mesotelioma | Tabaco = t', amianto = a ')

para todos os valores relevantes de te para estimar os efeitos da interação.

No seu exemplo concreto, vamos assumir que a variável de resultado é uma variável de Bernoulli - você pode ter mesotelioma ou não - e que uma pessoa foi exposta a um nível muito alto de amianto a. Então, é muito provável que ele sofra de mesotelioma; consequentemente, o efeito de aumentar a exposição ao tabaco será muito baixo. Por outro lado, se os níveis de amianto a 'forem muito baixos, o aumento da exposição ao tabaco terá um efeito maior. Isso constituiria uma interação entre os efeitos do tabaco e do amianto.

Obviamente, a estimativa não paramétrica pode ser extremamente exigente e barulhenta com dados finitos e muitos valores te e a diferentes; portanto, você pode pensar em assumir alguma estrutura em f (). Mas basicamente você pode fazer isso sem isso.

Julian Schuessler
fonte
Julian, obrigado pela profundidade da lógica de causalidade contrafactual de Pearl. Sua resposta seria melhorada por falar com a representação visual dos efeitos de interação que foi fundamental para a minha pergunta (Talvez dizendo "DAGs não fazem efeitos de interação explícita", ou o que você tem.)
Alexis
11
Sim você está certo; Eu tentei deixar isso mais claro desde o começo.
Julian Schuessler
Julian, isso é ótimo. Você diz que os blocos de construção de um DAG não são links individuais, C = f (D), mas geralmente conjuntos de links, C = f (D, E, ...). Meu problema é que Pearl às vezes é vago quanto a isso, por exemplo, em "Causalidade", seu Def 2.2.1 .: "Uma estrutura causal de um conjunto de variáveis ​​V é um DAG no qual cada nó corresponde a um elemento distinto de V, e cada O link representa um relacionamento funcional direto entre as variáveis ​​correspondentes ". Certamente, os vínculos individuais dos pais de C a C não significam nada por si mesmos, eles apenas mostram participação em uma influência coletiva em C. Você concorda?
21820 Steve
Sim. C = f (D, E) seria mostrado por dois links no gráfico de D / E a C. A interpretação dos links é que D e E determinam C. Portanto, é claro que os links são relacionais.
Julian Schuessler
10

A resposta simples é que você já faz. Os DAGs convencionais não representam apenas os efeitos principais, mas a combinação dos principais efeitos e interações. Depois de desenhar seu DAG, você já assume que quaisquer variáveis ​​que apontam para o mesmo resultado podem modificar o efeito das outras que apontam para o mesmo resultado. É uma suposição de modelagem, separada do DAG, que pressupõe a falta de uma interação.

Além disso, a interação pode ocorrer sem incluir um termo explícito de interação no seu modelo. Se você incluir efeitos principais apenas em um modelo para a razão de risco de Y com relação ao tratamento T e covariável Q, a estimativa da diferença de risco será diferente dependendo do nível de Q. Para acomodar todas essas possibilidades de forma não paramétrica, os DAGs apenas as suposições mais fracas sobre a forma funcional dos relacionamentos entre as variáveis, e assumindo que não há interação, é uma suposição mais forte que permite uma interação. Novamente, isso significa que os DAGs já permitem a interação sem nenhum ajuste. Veja Vanderweele (2009) para uma discussão sobre interação que usa DAGs convencionais, mas permite a interação.

Bollen & Paxton (1998) e Muthén & Asparouhov (2015) demonstram interações em modelos de caminhos com variáveis ​​latentes, mas essas interações se referem explicitamente a termos de produto em um modelo paramétrico, e não a interações em geral. Também vi diagramas semelhantes aos seus, onde a seta causal aponta para um caminho, mas, estritamente falando, um caminho não é uma quantidade única na qual uma variável possa ter um efeito causal (mesmo que seja assim que queremos interpretar nossos modelos) ; representa simplesmente a presença de um efeito causal, não sua magnitude.


Bollen, KA e Paxton, P. (1998). Interações de variáveis ​​latentes em modelos de equações estruturais. Modelagem de Equações Estruturais: A Multidisciplinary Journal, 5 (3), 267-293.

Muthén, B. & Asparouhov, T. (2015). Interações variáveis ​​latentes.

VanderWeele, TJ (2009). Sobre a distinção entre interação e modificação de efeito. Epidemiology, 20 (6), 863-871.

Noé
fonte
3
Além disso: "Depois de desenhar seu DAG, você já assume que quaisquer variáveis ​​que apontam para o mesmo resultado podem modificar o efeito das outras que apontam para o mesmo resultado. É uma suposição de modelagem, separada do DAG, que presume a falta de uma interação ". é brilhante ... realmente ajudou essas idéias a chegarem comigo.
Alexis16