Refiro-me a este artigo: Hayes JR, Groner JI. "Usando várias pontuações de imputação e propensão para testar o efeito de assentos de carro e uso de cinto de segurança na gravidade de lesões de dados de registro de trauma" J Pediatr Surg. Maio de 2008; 43 (5): 924-7.
Neste estudo, imputação múltipla foi realizada para obter 15 conjuntos de dados completos. Os escores de propensão foram então calculados para cada conjunto de dados. Em seguida, para cada unidade de observação, um registro foi escolhido aleatoriamente em um dos 15 conjuntos de dados concluídos (incluindo o escore de propensão relacionado), criando assim um único conjunto de dados final para o qual foi analisado por correspondência de escore de propensão.
Minhas perguntas são: Esta é uma maneira válida de realizar a correspondência de pontuação de propensão após imputação múltipla? Existem maneiras alternativas de fazer isso?
Por contexto: No meu novo projeto, pretendo comparar os efeitos de 2 métodos de tratamento usando a correspondência de propensão. Há dados ausentes e pretendo usar o MICE
pacote em R para atribuir valores ausentes, twang
fazer a correspondência de pontuação de propensão e depois lme4
analisar os dados correspondentes.
Update1:
Eu encontrei este artigo que tem uma abordagem diferente: Mitra, Robin e Reiter, Jerome P. (2011) Escore de propensão correspondente a covariáveis ausentes através de imputação múltipla sequencial e iterada [Working Paper]
Neste artigo, os autores calculam as pontuações de propensão em todos os conjuntos de dados imputados e depois os agrupam por média, o que está no espírito da imputação múltipla usando as regras de Rubin para uma estimativa de pontos - mas é realmente aplicável a uma pontuação de propensão?
Seria muito bom se alguém no CV pudesse fornecer uma resposta com comentários sobre essas 2 abordagens diferentes e / ou quaisquer outras ....
fonte
cobalt
pacote intitulado "Usando cobalto com dados complicados". Você pode acessá-lo aqui: CRAN.R-project.org/package=cobaltPode haver um choque de dois paradigmas. A imputação múltipla é uma solução bayesiana fortemente baseada em modelo: o conceito de imputação adequada afirma essencialmente que você precisa amostrar a partir da distribuição posterior bem definida dos dados, caso contrário, você está ferrado. A correspondência do escore de propensão, por outro lado, é um procedimento semi-paramétrico: depois de calcular o seu escore de propensão (não importa como, você poderia ter usado uma estimativa de densidade de kernel, não necessariamente um modelo de logit), você pode fazer o resto simplesmente considerando as diferenças entre as observações tratadas e as não tratadas com o mesmo escore de propensão, o que é meio não-paramétrico agora, já que não existe um modelo que controla outras covariáveis. Eu não'Abadie e Imbens (2008) discutiram que torna impossível realmente acertar os erros padrão em algumas situações correspondentes. Eu daria mais confiança às abordagens mais suaves, como a ponderação pela propensão inversa. Minha referência favorita sobre isso é "Econometria na maior parte inofensiva" , com o subtítulo "Um companheiro empirista", e destinada a economistas, mas acho que este livro deve ser uma leitura obrigatória para outros cientistas sociais, a maioria dos bioestatísticos e estatísticos não-bio, bem como que eles sabem como outras disciplinas abordam a análise de dados.
De qualquer forma, usar apenas uma das 15 linhas de dados completas simuladas por observação é equivalente a uma única imputação. Como resultado, você perde eficiência em comparação com todos os 15 conjuntos de dados concluídos e não pode estimar os erros padrão corretamente. Parece um procedimento deficiente para mim, de qualquer ângulo.
É claro que, felizmente, varremos para debaixo do tapete a suposição de que tanto o modelo de imputação múltipla quanto o modelo de propensão estão corretos no sentido de termos todas as variáveis corretas nas formas funcionais corretas. Há pouca maneira de verificar isso (embora eu fique feliz em saber o contrário sobre as medidas de diagnóstico para esses dois métodos).
fonte
Eu realmente não posso falar com os aspectos teóricos da pergunta, mas darei minha experiência usando modelos PS / IPTW e imputação múltipla.
fonte