Confounder - definição

14

De acordo com M. Katz em seu livro Multivariable analysis (Seção 1.2, página 6), " Um fator de confusão está associado ao fator de risco e causalmente relacionado ao resultado " . Por que o fator de confusão deve estar causalmente relacionado ao resultado? Seria suficiente o fator de confusão associado ao resultado?

marco
fonte
5
Olá @marco, bem-vindo ao site! Miguel Hernan tem um PDF grátis de seu livro "Causal Inference". A parte 1 (capítulo 7 na página 83) discute a estrutura da confusão. Essa poderia ser uma leitura interessante. Ele escreve especificamente: "Confundir é o viés que surge quando o tratamento e o resultado compartilham uma causa comum".
COOLSerdash
2
Este post também lança alguma luz sobre confusão.
COOLSerdash

Respostas:

21

Por que o fator de confusão deve estar causalmente relacionado ao resultado? Seria suficiente o fator de confusão associado ao resultado?

Não, não é suficiente.

Vamos começar com o caso em que você pode ter uma variável que está associada ao resultado e ao tratamento, mas o controle disso influenciaria sua estimativa.

Por exemplo, considere o seguinte gráfico causal, retirado de Pearl , em queZ é um colisor de pré-tratamento:

insira a descrição da imagem aqui

Nesse caso, não há confusão, você pode estimar o efeito de X em Y diretamente.

Observe, no entanto, que Z está associado ao tratamento e ao resultado. Mas ainda não é um fator de confusão. De fato, se você controla Z nesse caso, influenciaria sua estimativa. Essa situação é chamada de polarização M (devido à estrutura do gráfico).

Outro caso semelhante, mais direto, em que você não deve controlar é quando a variável é resultado do tratamento. X e do resultado Y. Veja este gráfico simples de colisor:

insira a descrição da imagem aqui

Aqui, novamente, Z está associado a X e Y, mas não é um co-fundador. Você não deve controlar isso.

Agora, vale notar que, mesmo que uma variável esteja causalmente relacionada ao resultado , ela também não é necessariamente um fator de confusão.

Vamos considerar o caso dos mediadores, no gráfico simples abaixo:

insira a descrição da imagem aqui

Se você deseja medir o efeito total de D em Y, não deve controlar as coisas que mediam o efeito --- neste caso M. Ou seja, M é causalmente relacionado a Y, mas não é um fator de confusão em relação ao efeito total de D em Y também.


Observe, no entanto, que definir confusão é muito mais fácil do que definir o que é um fator de confusão . Para uma discussão mais rigorosa sobre a definição de confusão , você pode ler este artigo de VanderWeele e Shpitser.

Por que esse é o caso? Porque o conceito principal aqui é o de confusão em si, não de confusão. Para sua pergunta de pesquisa, você deve se perguntar "como posso eliminar a confusão?" em vez de "essa variável é um fator de confusão?".

E como nota final, vale ressaltar que esses equívocos ainda são comuns. Apenas para ilustrar, tomemos esta citação de um artigo de 2016 :

A inferência causal na ausência de um experimento randomizado ou de um design quase experimental forte requer um condicionamento adequado de todas as variáveis ​​de pré-tratamento que predizem o tratamento e o resultado, também conhecidas como covariáveis ​​confusas.

Como mostramos nos exemplos anteriores, isso está incorreto. Os fatores de confusão não são "todas as variáveis ​​de pré-tratamento que predizem o tratamento e o resultado". O controle de todos eles pode não ser necessário para eliminar a confusão ou até influenciar seus resultados. Pearl tem uma visão geral muito boa da confusão aqui.

Carlos Cinelli
fonte