Qual é a diferença entre as pontuações de propensão e a adição de covariáveis ​​em uma regressão e quando elas são preferidas a esta?

41

Admito que sou relativamente novo em escores de propensão e análise causal.

Uma coisa que não é óbvia para mim como iniciante é como o "equilíbrio" usando escores de propensão é matematicamente diferente do que acontece quando adicionamos covariáveis ​​em uma regressão? O que há de diferente na operação e por que é (ou é) melhor do que adicionar covariáveis ​​de subpopulação em uma regressão?

Eu já vi alguns estudos que fazem uma comparação empírica dos métodos, mas ainda não vi uma boa discussão relacionando as propriedades matemáticas dos dois métodos e por que o PSM se presta a interpretações causais, enquanto não inclui covariáveis ​​de regressão. Também parece haver muita confusão e controvérsia nesse campo, o que dificulta ainda mais as coisas.

Alguma opinião sobre isso ou alguma indicação de bons recursos / documentos para entender melhor a distinção? (Estou lentamente percorrendo o livro de causalidade da Judea Pearl, então não há necessidade de me indicar isso)

Frank Barry
fonte
3
Recomendamos que você leia Morgan e Winship, 2007 . Os capítulos 4 e 5 fazem uma comparação e contraste explícitos de regressão e correspondência para identificação do efeito causal.
conjugateprior
11
Ao verificar as estatísticas do saldo, você garante que não haja extrapolação entre os grupos de tratamento que você está comparando em relação ao espaço covariável multidimensional. A regressão simplesmente extrapola sem verificar isso; portanto, as extrapolações podem fornecer previsões ruins.
precisa saber é o seguinte

Respostas:

17

Uma grande diferença é que a regressão "controla" essas características de maneira linear. A correspondência por escores de propensão elimina a suposição de linearidade, mas, como algumas observações podem não corresponder, talvez você não consiga dizer nada sobre determinados grupos.

Por exemplo, se você estiver estudando um programa de treinamento para trabalhadores, pode ser que todos os inscritos sejam homens, mas a população de controle e não participante seja composta por homens e mulheres. Usando a regressão, você pode regredir, renda, por exemplo, em uma variável de indicador de participação e em um indicador masculino. Você usaria todos os seus dados e poderia estimar a renda de uma mulher se ela participasse do programa.

Se você estivesse combinando, só poderia combinar homens com homens. Como resultado, você não usaria nenhuma mulher em sua análise e seus resultados não pertenceriam a elas.

A regressão pode extrapolar usando a suposição de linearidade, mas a correspondência não pode. Todas as outras suposições são essencialmente as mesmas entre regressão e correspondência. O benefício da correspondência sobre a regressão é que ela não é paramétrica (exceto que você deve assumir que possui a pontuação de propensão correta, se é assim que está fazendo a correspondência).

Para mais discussões, veja minha página aqui para um curso que foi fortemente focado em métodos de correspondência. Consulte as premissas da estratégia de estimativa de efeitos causais .

Além disso, verifique o artigo de Rosenbaum e Rubin (1983) que descreve a correspondência de propensão.

Por fim, a correspondência percorreu um longo caminho desde 1983. Confira a página de Jas Sekhon para aprender sobre seu algoritmo de correspondência genética.

Charlie
fonte
3
Talvez seja porque eu não sou estatístico, mas quando parece que você assumiu regressão linear quando o OP perguntou sobre regressão em geral. Mas acho que a essência é que a adição de covariáveis ​​a qualquer tipo de regressor faz algumas suposições sobre o espaço de entrada para que ele possa extrapolar para novos exemplos, e a correspondência é mais cautelosa sobre que tipo de coisas podem ser extrapoladas.
Rrenaud 9/04
2
Você faz algumas suposições sobre a forma funcional das variáveis ​​de confusão ao estimar a função de propensão. Você também combina posteriormente com indivíduos que têm valores "próximos" da propensão, para que eu não assuma imediatamente que a correspondência de propensão resolve o problema dos efeitos de confusão não-lineares.
AdamO 7/08/16
2
Os links estão quebrados.
Carlos Cinelli
11

A resposta curta é que os escores de propensão não são melhores que o modelo equivalente da ANCOVA, particularmente no que diz respeito à interpretação causal.

Os escores de propensão são melhor entendidos como um método de redução de dados. Eles são um meio eficaz de reduzir muitas covariáveis ​​em uma única pontuação que pode ser usada para ajustar um efeito de interesse para um conjunto de variáveis. Ao fazer isso, você economiza graus de liberdade ajustando para uma única pontuação de propensão em vez de várias covariáveis. Isso apresenta uma vantagem estatística, certamente, mas nada mais.

Uma questão que pode surgir ao usar o ajuste de regressão com escores de propensão é se existe algum ganho no uso do escore de propensão em vez de realizar um ajuste de regressão com todas as covariáveis ​​usadas para estimar o escore de propensão incluído no modelo. Rosenbaum e Rubin mostraram que a "estimativa pontual do efeito do tratamento de uma análise de ajuste de covariância para X multivariado é igual à estimativa obtida de um ajuste de covariância univariada para o discriminante linear da amostra baseado em X, sempre que a mesma matriz de covariância da amostra é usada tanto para o ajuste de covariância quanto para a análise discriminante ". Assim, os resultados de ambos os métodos devem levar às mesmas conclusões. Contudo, Uma vantagem de executar o procedimento de duas etapas é que é possível ajustar um modelo de pontuação de propensão muito complicado com interações e termos de ordem superior primeiro. Como o objetivo desse modelo de escore de propensão é obter a melhor probabilidade estimada de atribuição de tratamento, não se preocupa em parametrizar demais esse modelo.

A partir de:

MÉTODOS DE PONTUAÇÃO DE PROPENSIDADE PARA REDUÇÃO DE BIAS NA COMPARAÇÃO DE UM TRATAMENTO A UM GRUPO DE CONTROLE NÃO RANDOMIZADO

D'Agostino (citando Rosenbaum e Rubin)

D'agostino, RB 1998. Escore de propensão correspondente à redução do viés na comparação de um tratamento com um grupo controle não randomizado. Statistical Medicine 17: 2265-2281.

Brett
fonte
5
(+1) Também havia uma discussão interessante sobre a questão da causalidade nesta questão relacionada: De uma perspectiva estatística, pode-se inferir a causalidade usando escores de propensão em um estudo observacional? .
chl
3
Concordo com a premissa geral desta resposta, mas quando se corresponde com base nas pontuações de propensão, não é o mesmo que inserir todas as covariáveis ​​no modelo (e, portanto, não é apenas uma técnica de redução de dimensão). Não é a mesma coisa se alguém pesa por propensão também.
22711 Andy W
11
Eu discordo desta resposta. Os escores estimados de propensão são bons quando eles equilibram covariáveis ​​nos grupos de tratamento e controle e ruins quando não. Da mesma forma que para uma abordagem de condicionamento de regressão. Se eles são 'melhores' depende apenas dessa propriedade, que varia de problema para problema.
conjugateprior
11
Discordo porque, embora o critério equilíbrio seja o mesmo, as duas estratégias são diferentes, assim como seus pontos fortes e fracos. Pode-se ou não ser uma abordagem melhor, dependendo do problema. De fato, o ' modelo ANCOVA equivalente ' me parece não estar bem definido. (Equivalente como?)
conjugateprior
11
Direita. Agora vejo o que 'equivalente' significava, mas a frase que começa com 'No entanto' em sua citação introduz a diferença relevante: na prática prop. as pontuações são estimadas separadamente com precisão para que possam ser muito mais complicadas que o modelo de análise. (E há outra diferença no artigo de parágrafo seguinte, não cotados.)
conjugateprior
7

Uma referência obtusa provável, mas se você tiver acesso a ela, recomendo a leitura deste capítulo do livro ( Apel e Sweeten, 2010 ). Ele é voltado para cientistas sociais e, portanto, talvez não seja tão matematicamente rigoroso quanto você parece querer, mas deve ser aprofundado o suficiente para ser mais do que uma resposta satisfatória para sua pergunta.

Existem algumas maneiras diferentes pelas quais as pessoas tratam os escores de propensão que podem resultar em conclusões diferentes, simplesmente incluindo covariáveis ​​em um modelo de regressão. Quando se combina as pontuações, não há necessariamente um suporte comum para todas as observações (ou seja, há algumas que parecem nunca ter a chance de estar no grupo de tratamento e outras que sempre estão no grupo de tratamento). Também se pode ponderar observações de várias maneiras que podem resultar em conclusões diferentes.

Além das respostas aqui, eu também sugiro que você verifique as respostas para a pergunta citada. Há mais substância por trás das pontuações de propensão do que simplesmente um truque estatístico para alcançar o equilíbrio covariável. Ao ler e entender os artigos altamente citados por Rosenbaum e Rubin, ficará mais claro por que a abordagem é diferente do que simplesmente adicionar covariáveis ​​em um modelo de regressão. Eu acho que uma resposta mais satisfatória para sua pergunta não está necessariamente na matemática por trás das pontuações de propensão, mas em sua lógica.

Andy W
fonte
@ Andy W Veja a citação de Rosenbaum e Rubin sobre a equivalência da regressão com covariáveis ​​e ajuste do escore de propensão no meu post atualizado.
22912 Brett
0

Eu gosto de pensar no PS como uma parte do projeto que foi completamente separada da análise. Ou seja, você pode querer pensar em termos de design (PS) e análise (regressão etc ...). Além disso, o PS fornece um meio de suporte à permutabilidade para tratamento binário; talvez outros possam comentar se a inclusão das covariáveis ​​no modelo de resultado pode realmente apoiar a permutabilidade ou se alguém assume a permutabilidade antes de incluir as covariáveis ​​no modelo de resultado.

Teoria de Galois
fonte
-3

Stat Methods Med Res. 2016 19 de abril.

Uma avaliação do viés nos modelos de regressão não linear ajustados ao escore de propensão.

Os métodos de pontuação de propensão são comumente usados ​​para ajustar a confusão observada ao estimar o efeito do tratamento condicional em estudos observacionais. Um método popular, o ajuste covariável do escore de propensão em um modelo de regressão, mostrou empiricamente ser enviesado em modelos não lineares. No entanto, nenhuma razão teórica subjacente convincente foi apresentada. Propomos uma nova estrutura para investigar o viés e a consistência dos efeitos do tratamento ajustado ao escore de propensão em modelos não lineares que usam uma abordagem geométrica simples para estabelecer um vínculo entre a consistência do estimador de escore de propensão e a colapsibilidade de modelos não lineares. Sob essa estrutura, demonstramos que o ajuste do escore de propensão em um modelo de resultado resulta na decomposição das covariáveis ​​observadas no escore de propensão e em um termo restante. A omissão deste termo remanescente de um modelo de regressão não recolhível leva a estimativas tendenciosas da razão de chances condicional e da taxa de risco condicional, mas não para a taxa de taxa condicional. Mostramos ainda, por meio de estudos de simulação, que o viés desses estimadores ajustados ao escore de propensão aumenta com um tamanho de efeito de tratamento maior, efeitos de covariáveis ​​maiores e crescente dissimilaridade entre os coeficientes das covariáveis ​​no modelo de tratamento versus o modelo de resultado.

dt2016
fonte