Eu tenho um conjunto de dados longitudinal de indivíduos e alguns deles foram submetidos a um tratamento e outros não. Todos os indivíduos estão na amostra desde o nascimento até os 18 anos e o tratamento ocorre em alguma idade entre esse intervalo. A idade do tratamento pode variar entre os casos. Usando a correspondência de propensão, eu gostaria de combinar as unidades tratadas e de controle em pares com a correspondência exata no ano de nascimento, para que eu possa acompanhar cada par desde o nascimento até os 18 anos. No total, existem cerca de 150 indivíduos tratados e 4000 não tratados. Após a correspondência, a idéia é usar uma estratégia de diferença de diferenças para estimar o efeito do tratamento.
O problema que enfrento no momento é fazer a correspondência com os dados do painel. Estou usando o psmatch2
comando Stata e comparo as características domésticas e individuais usando a correspondência de propensão. Em geral, com os dados do painel, haverá diferentes combinações ótimas para cada idade. Como exemplo: se A é tratado, B e C são controles e todos nasceram em 1980, então A e B podem corresponder em 1980 aos 0 anos de idade, enquanto A e C são correspondidos em 1981 aos 1 anos de idade e assim por diante. . Também A pode ser combinado com seus próprios valores de pré-tratamento de anos anteriores.
Para contornar esse problema, calculei a média de todas as variáveis que variam no tempo, de modo que a correspondência possa identificar indivíduos que são, em média, os mais semelhantes ao longo da duração da amostra e eu faço a correspondência separadamente para cada faixa etária de 0 a 18 anos. Infelizmente, isso ainda corresponde a uma unidade de controle diferente para cada unidade tratada por faixa etária.
Se alguém pudesse me direcionar para um método de correspondência pareada com os dados do painel no Stata, isso seria muito apreciado.
Não há como fazer isso no Stata ou em qualquer outro software que eu conheça.
Se você estiver tentando corrigir um estimador de correspondência tendenciosa com técnicas de dados em painel, aqui está uma abordagem que pode funcionar. Se você puder supor que a correspondência cuida de alguns, mas não de todo o viés de seleção, mas que o viés permanece em grande parte constante ao longo do tempo, você pode remover a parte invariável do tempo do viés construindo estimativas de correspondência separadas em cada período e analisando A diferença.
Os documentos de Heckman, Ichimura, Smith e Todd 1998 Econometrica e Eichler e Lechner 2002 Labor Economics são exemplos dessa abordagem. Por outro lado, 150 observações tratadas podem não ser suficientes para que essa abordagem funcione.
fonte
Passos:
Como foi mencionado em detalhes por Greg, você pode usar um conjunto de dados transversal, tanto no pré-tratamento quanto em um período de pré-tratamento específico para gerar a correspondência.
Usando o painel inteiro, você atribui variáveis indicadoras para
a. indivíduo tratado
b. tratadoPeríodo, este último é igual a zero assim que o tratamento ocorre para o indivíduo tratado.
Como o ponto em que o periodo tratado muda de 0 para 1 varia entre indivíduos e nunca passa para 1 para não tratado, você deve atribuir o mesmo ponto de partida da correspondência tratada à correspondência não tratada. Isso é intuitivo, mas eu ainda gostaria de ver uma boa referência que justifique essa abordagem que ainda não encontrei.
A configuração da regressão seria:
onde o termo de interação fornece o efeito do tratamento.
fonte
Você considerou usar o comando nnmatch ?
Eu uso esse comando e é bastante abrangente. Ele leva em consideração diferentes algoritmos de correspondência e também casos em que o escore de propensão é o mesmo para alguns indivíduos do grupo de controle. Obviamente, o tratamento desse caso depende do algoritmo de correspondência, se você usar o k-vizinho mais próximo ou o kernel ou qualquer outra coisa.
fonte