Confounder - definição

De acordo com M. Katz em seu livro Multivariable analysis (Seção 1.2, página 6), " Um fator de confusão está associado ao fator de risco e causalmente relacionado ao resultado " . Por que o fator de confusão deve estar causalmente relacionado ao resultado? Seria suficiente o fator de confusão associado ao resultado?

causality definition confounding marco
fonte

Olá @marco, bem-vindo ao site! Miguel Hernan tem um PDF grátis de seu livro "Causal Inference". A parte 1 (capítulo 7 na página 83) discute a estrutura da confusão. Essa poderia ser uma leitura interessante. Ele escreve especificamente: "Confundir é o viés que surge quando o tratamento e o resultado compartilham uma causa comum".

COOLSerdash

Este post também lança alguma luz sobre confusão.

COOLSerdash

Por que o fator de confusão deve estar causalmente relacionado ao resultado? Seria suficiente o fator de confusão associado ao resultado?

Não, não é suficiente.

Vamos começar com o caso em que você pode ter uma variável que está associada ao resultado e ao tratamento, mas o controle disso influenciaria sua estimativa.

Por exemplo, considere o seguinte gráfico causal, retirado de Pearl , em que $Z$ é um colisor de pré-tratamento:

Nesse caso, não há confusão, você pode estimar o efeito de X em Y diretamente.

Observe, no entanto, que Z está associado ao tratamento e ao resultado. Mas ainda não é um fator de confusão. De fato, se você controla Z nesse caso, influenciaria sua estimativa. Essa situação é chamada de polarização M (devido à estrutura do gráfico).

Outro caso semelhante, mais direto, em que você não deve controlar é quando a variável é resultado do tratamento. $X$ e do resultado $Y$ . Veja este gráfico simples de colisor:

Aqui, novamente, Z está associado a X e Y, mas não é um co-fundador. Você não deve controlar isso.

Agora, vale notar que, mesmo que uma variável esteja causalmente relacionada ao resultado , ela também não é necessariamente um fator de confusão.

Vamos considerar o caso dos mediadores, no gráfico simples abaixo:

Se você deseja medir o efeito total de D em Y, não deve controlar as coisas que mediam o efeito --- neste caso M. Ou seja, M é causalmente relacionado a Y, mas não é um fator de confusão em relação ao efeito total de D em Y também.

Observe, no entanto, que definir confusão é muito mais fácil do que definir o que é um fator de confusão . Para uma discussão mais rigorosa sobre a definição de confusão , você pode ler este artigo de VanderWeele e Shpitser.

Por que esse é o caso? Porque o conceito principal aqui é o de confusão em si, não de confusão. Para sua pergunta de pesquisa, você deve se perguntar "como posso eliminar a confusão?" em vez de "essa variável é um fator de confusão?".

E como nota final, vale ressaltar que esses equívocos ainda são comuns. Apenas para ilustrar, tomemos esta citação de um artigo de 2016 :

A inferência causal na ausência de um experimento randomizado ou de um design quase experimental forte requer um condicionamento adequado de todas as variáveis de pré-tratamento que predizem o tratamento e o resultado, também conhecidas como covariáveis confusas.

Como mostramos nos exemplos anteriores, isso está incorreto. Os fatores de confusão não são "todas as variáveis de pré-tratamento que predizem o tratamento e o resultado". O controle de todos eles pode não ser necessário para eliminar a confusão ou até influenciar seus resultados. Pearl tem uma visão geral muito boa da confusão aqui.

Carlos Cinelli
fonte

Confounder - definição

Respostas: