Viés de superação e variáveis ​​de confusão

8

Pelo que entendi, a correspondência é uma maneira de identificar a causalidade nos estudos observacionais. Combinando observações "semelhantes" e comparando aquelas que receberam ou não tratamento, você pode considerar isso como uma espécie de quase experimento.

O que é overmatching? Que tipo de viés ele introduz? Vi principalmente a correspondência do ponto de vista econômico, mas recentemente vi alguns trabalhos sobre epidemiologia sugerindo que "superação" pode resultar em viés. Acho difícil entender a terminologia dos trabalhos e gostaria muito que alguém pudesse ajudar a explicar alguns dos principais conceitos. Abaixo está um artigo que faz referência à ideia:

A correspondência excessiva pode causar viés. BMJ. 2002 10 de agosto; 325 (7359)

d_a_c321
fonte

Respostas:

11

De Modern Epidemiology 3rd Edition por Rothman, Greenland and Lash:

Existem pelo menos três formas de superação. O primeiro refere-se à correspondência que prejudica a eficiência estatística, como a correspondência de controle de caso em uma variável associada à exposição, mas não à doença. O segundo refere-se à correspondência que prejudica a validade, como a correspondência em um intermediário entre exposição e doença. O terceiro refere-se à correspondência que prejudica a eficiência de custos.

A resposta de AndyW é sobre a segunda forma de ultrapassagem. Resumidamente, veja como eles funcionam:

1: Para ser um fator de confusão, um dos critérios é que a covariável esteja associada ao resultado e à exposição. Se estiver associado apenas a um deles, não é um fator de confusão e tudo o que você conseguiu fazer foi aumentar seu intervalo de confiança.

Para explorar ainda mais esse tipo de superação, considere um estudo de caso-controle correspondente de uma exposição binária, com um controle correspondente a cada caso em um ou mais fatores de confusão. Cada estrato na análise consistirá em um caso e um controle, a menos que alguns estratos possam ser combinados. Se o caso e seu controle correspondente forem expostos ou não expostos, uma margem da tabela 2 x 2 será 0 ... esse par de sujeitos não contribuirá com nenhuma informação para a análise. Se alguém estratifica em correlatos de exposição, aumenta a chance de tais tabelas ocorrerem e, portanto, tende a aumentar as informações perdidas na análise estratificada.

2: Isso é parcialmente discutido por AndyW. A correspondência em um fator intermediário influenciará sua estimativa, assim como a correspondência em algo afetado pela exposição e pelo resultado. Isso é essencialmente controlar um colisor, e qualquer técnica que o faça irá influenciar sua estimativa.

Se, no entanto, o fator de correspondência potencial for afetado pela exposição e o fator, por sua vez, afetar a doença (ou seja, é uma variável intermediária) ou for afetado pela exposição e pela doença, a correspondência no fator influenciará o efeito bruto e ajustado estimativas. Nessas situações, a correspondência caso-controle nada mais é do que uma forma irreparável de viés de seleção.

3: Esse é mais um problema de design de estudo. A correspondência extensiva de variáveis ​​nas quais você não precisa corresponder pelos motivos 1 e 2 pode fazer com que você rejeite controles facilmente obtidos (amigos, família, rede social próxima etc.) em favor de controles muito mais difíceis de obter que podem ser comparados com os conjunto desnecessário de covariáveis. Isso custa dinheiro - dinheiro que poderia ter sido gasto em mais assuntos, melhor exposição ou apuração de doenças, etc., sem ganho apreciável de preconceito ou precisão e, de fato, ameaçando ambos.

Fomite
fonte
1
(+1) Boa resposta. Não estou tão surpreso ao ver que o livro de Rothman & Greenland é novamente uma boa referência para manter em nossa mesa, sempre de fácil acesso.
chl
7

Embora eu também ignorasse a terminologia de "excesso de correspondência", um exemplo da mesma idéia que ouvi na linguagem econômica e estatística poderia estar correspondendo a um resultado "intermediário". Veja as publicações de Andrew Gelman sobre o assunto

Esse é o mesmo problema descrito no começo do artigo que você cita ( Marsh et al., 2002 )

Se a própria exposição levar ao fator de confusão ou se tiver um status igual, a estratificação pelo fator de confusão também será estratificada pela exposição, e a relação da exposição com a doença será obscurecida. Isso é chamado de correspondência excessiva ...

Gelman dá um exemplo conceitualmente claro no post "Fazer filhos torná-lo mais conservador"? Em termos simples (sem exemplos), é só você ter suas direções causais ao contrário.

Andy W
fonte
1
Direita. No livro de Josh Angrist, Mostly Harmless Econometrics, ele se refere aos mesmos fenômenos que um "controle ruim". Ele dá o exemplo de regressão dos salários em educação e ocupação. Essa é uma regressão horrível, uma vez que é identificada por diferenças na educação dentro de uma ocupação (por exemplo, se a ocupação for advogada, não faria sentido analisar essas diferenças de educação) e a educação é o que permitiu que você fosse advogado! Eu suspeitava que o viés de super correspondência fosse esse. Talvez um epidiomologista venha para confirmar. Obrigado pelos ótimos links do Gelman, vou vê-los.
d_a_c321
1
Muito interessante e acho que é um tópico importante e pouco discutido.
rolando2