Na análise do escore de propensão, quais são as opções para lidar com propensões muito pequenas ou grandes?

8

Estou preocupado com dados observacionais nos quais a atribuição do tratamento pode ser explicada extremamente bem. Por exemplo, uma regressão logística de

P(A=1|X)=(1+exp((Xβ)))1

wehre A atribuição tratamento e X covariáveis tem ajuste muito bom com muito alto teste AUC>.80 ou mesmo >.90 . Essa é uma boa notícia para a precisão do modelo de propensão, mas leva a estimativas de pontuação de propensão

π^=(1+exp((Xβ^)))1
fechar para 0 ou 1 . Estes, por sua vez, levam a grandes pesos de probabilidade inversa π^1 e (1π^)1 usados ​​em estimadores, como o estimador ponderado por probabilidade inversa de expectativa de resultado Y1 (observação em tratamento):

n1iπi^1AiY1i.

Suspeito que isso mude muito as variações das estimativas.

Parece um círculo vicioso que modelos de pontuação de propensão muito discriminativos levam a pesos extremos.

Minha pergunta : quais são as opções disponíveis para tornar essa análise mais robusta? Existem alternativas para ajustar-se ao modelo de pontuação de propensão ou como lidar com grandes pesos após o ajuste do modelo?

tomka
fonte
3
Você pode dar uma olhada nas covariáveis ​​com cuidado. Você deve incluir todas as variáveis ​​que afetam a participação e os resultados (não ambos, mas ambos). Incluir os afetados pelo tratamento, ex post ou ex ante, em antecipação ao tratamento, é ruim. Em particular, incluir instrumentos - variáveis ​​que afetam a participação e não os resultados - também é uma idéia particularmente ruim. Eles não ajudarão com o viés de seleção e podem piorar drasticamente o problema de suporte. Por exemplo, se algumas pessoas são incentivadas a fazer o tratamento, você não quer condicionar isso.
Dimitriy V. Masterov
@ DimitriyV.Masterov Obrigado; seus últimos pontos parecem interessantes / relevantes para a minha situação. Então você está dizendo que é melhor não encontrar o melhor modelo de atribuição de tratamento (mas sim o que inclui os preditores de resultado e atribuição)? Eu pensei que quanto mais precisamente pudermos prever tarefas, melhor.
Tomka
2
Eu acho que é um equívoco comum. Por exemplo, veja o artigo de Battacharya e Vogt (2012) no International Journal of Statistics and Economics sobre o ponto de instrumentos.
Dimitriy V. Masterov
@ DimitriyV.Masterov enquanto a sua resposta pode resolver o problema dos pequenos propensões em algumas situações, pode ainda ser o caso que o conjunto de relativo a ambos e é muito discriminativo em . Ainda estou interessado em opções para lidar com esse problema. Y A AXYAA
Tomka

Respostas:

5

Esta é uma boa detecção. Você está se referindo à suposição de positividade. Exige que haja participantes expostos e não expostos em todas as combinações dos valores dos fatores de confusão observados na população em estudo. As violações de positividade ocorrem quando determinados subgrupos de uma amostra raramente ou nunca recebem alguns tratamentos de interesse. Existem muitos trabalhos sobre esse tema, como Austin e Stuart (2015) e Peterson et al. (2012) . Você pode procurar mais online.

user36400
fonte
2
Obrigado, mas você tem certeza? Estou me referindo a pesos muito pequenos ou grandes. O que você descreve parece mais uma sobreposição entre as distribuições de propensão de unidades tratadas e não tratadas (o que aparentemente é chamado positividade, eu não sabia). No entanto, parece que pode haver sobreposição (positividade) enquanto ainda há pesos extremos, não?
Tomka
Também não pode haver sobreposição (positividade) sem ter pesos extremos, acredito.
Tomka
Esse artigo da Austin & Stuart discute o uso de pesos estabilizados, o que pode ser útil para a sua situação.
Noé
@Noah viu isso. É um bom ponto de partida. Infelizmente, eles não documentam muito bem essa alegação e o efeito que ela tem nas estimativas quando as propensões são extremas não é conhecido.
Tomka