Intervalo de confiança para o efeito médio do tratamento a partir da ponderação do escore de propensão?

9

Estou tentando estimar o efeito médio do tratamento a partir de dados observacionais usando a ponderação do escore de propensão (especificamente IPTW). Acho que estou calculando o ATE corretamente, mas não sei como calcular o intervalo de confiança do ATE, considerando os pesos da pontuação de propensão inversa.

Aqui está a equação que estou usando para calcular o efeito médio do tratamento (referência Stat Med. 10 de setembro de 2010; 29 (20): 2137-2148.): Onde número total de sujeitos, estado do tratamento, estado resultado, e pontuação propensão.

ATE=1N1NZiYipi1N1N(1Zi)Yi1pi
N=Zi=Yi=pi=

Alguém conhece um pacote R que calcule o intervalo de confiança do efeito médio do tratamento, levando em consideração os pesos? O surveypacote poderia ajudar aqui? Eu queria saber se isso iria funcionar:

library(survey)
sampsvy=svydesign(id=~1,weights=~iptw,data=df)
svyby(~surgery=='lump',~treatment,design=sampsvy,svyciprop,vartype='ci',method='beta')

#which produces this result:
  treatment surgery == "lump"      ci_l      ci_u
   No         0.1644043 0.1480568 0.1817876
   Yes         0.2433215 0.2262039 0.2610724

Não sei para onde ir daqui para encontrar o intervalo de confiança da diferença entre as proporções (isto é, o efeito médio do tratamento).

JJM
fonte
Não posso responder especificamente, mas o livro "Pesquisas complexas: um guia para análise usando R", do autor do pacote de pesquisa, abrange o IPTW e pode ser útil. books.google.com/…
kaz_yos

Respostas:

11

Você não precisa do surveypacote nem de nada complicado. Wooldridge (2010, p. 920 em diante) "Análise Econométrica de Seção Transversal e Dados de Painel" tem um procedimento simples a partir do qual você pode obter os erros padrão para construir os intervalos de confiança.

Supondo que você especificou corretamente o escore de propensão que designamos como , defina o escore a partir da estimativa do escore de propensão (ou seja, sua primeira regressão logit ou probit ) como e deixe conforme a expressão acima. Em seguida, pegue os exemplos análogos dessas duas expressões e regride emp(xi,γ)

di=γp(xi,γ)[Zip(xi,γ)]p(xi,γ)[1p(xi,γ)]
ATEi=[Zip(xi,γ)]Yip(xi,γ)[1p(xi,γ)]
ATE^id^i. Certifique-se de incluir uma interceptação nesta regressão. Seja o resíduo dessa regressão, a variação assintótica de é simplesmente . Portanto, o erro padrão assintótico do seu ATE é eiN(ATE^ATE)Var(ei)
[1Ni=1Nei2]12N

Você pode calcular o intervalo de confiança da maneira usual (veja, por exemplo, os comentários da resposta aqui para obter um exemplo de código). Você não precisa ajustar o intervalo de confiança novamente para os pesos do escore de propensão inversa, pois esta etapa já foi incluída no cálculo dos erros padrão.

Infelizmente, eu não sou do tipo R e não posso fornecer o código específico, mas o procedimento descrito acima deve ser fácil de seguir. Como uma observação lateral, esta também é a maneira pela qual o treatrewcomando no Stata funciona. Este comando foi escrito e introduzido no Stata Journal por Cerulli (2014) . Se você não tem acesso ao artigo, pode verificar os slides, que também descrevem o procedimento de cálculo dos erros padrão a partir da ponderação do escore de propensão inversa. Lá, ele também discute algumas pequenas diferenças conceituais entre estimar o escore de propensão via logit ou probit, mas, para obter essa resposta, não era muito importante, então eu omiti essa parte.

Andy
fonte