3 perguntas relacionadas sobre estimadores de DDD (TD, triple-diff)

8

Na Econometric Analysis de Jeff Wooldridge (2ª edição), ele deriva a expressão para o estimador de diferença-em-diferença-em-diferenças (DDD) na página 151 para o período de dois períodos em que o estado B implementa uma mudança na política de saúde voltada para idosos .

Primeiro, estou intrigado com o porquê da equação (6.56) não ter um quarto termo de

(y¯UMA,N,2-y¯UMA,N,1),

o que corresponderia à alteração dos resultados médios de saúde para os não idosos (grupo N) nos estados que não alteram sua política (grupo A).

Ele cita Gruber (1994) como usando esse método, mas minha leitura da tabela 3 nesse artigo é que há uma diferença de dois DDs; portanto, você precisa do quarto termo para obtê-lo (caso contrário, obtém vez de apenas ).δ 3δ3+δ0 0δ3

Eu já verifiquei as erratas para a segunda impressão e isso não ocorreu, então devo estar faltando alguma coisa aqui. Ele também aparece em suas notas de aula do NBER de 2007 da mesma forma.


Minha segunda pergunta é que, no caso de mais de dois períodos, JW sugere uma regressão que inclui:

  • um conjunto completo de manequins para o tipo de estado (A ou B)
  • um conjunto completo de manequins para a categoria etária (E ou N)
  • manequins para todos os períodos
  • interações pareadas entre os três anteriores
  • um manequim de política que assume o valor de 1 para grupos e períodos sujeitos à política, que é o parâmetro de interesse DDD

JW escreve "conjuntos completos de manequins" e "todos os períodos", mas não sei como isso pode ser feito sem cair na armadilha da variável fictícia. Pode parecer natural abandonar o estado do tipo A e o não idoso (grupo N), mas digamos que tenho 10 períodos e o tratamento ocorre no período 5. Como escolher qual horário do manequim cair para evitar o manequim armadilha variável? Essa opção parece alterar o parâmetro DDD e sua interpretação, mas não tenho certeza se é o melhor. Aqui está outra questão em que há uma escolha natural, porque há um único período pré que serve como linha de base.


Finalmente, qual é exatamente o pressuposto de identificação com DDD, análogo às tendências comuns com DD simples? Existem maneiras de testá-lo / reforçá-lo com vários períodos?

Na Microeconomia Econômica para Efeitos de Políticas, Programas e Tratamento de Myoung-jae Lee , a condição (traduzida no exemplo de JW) é listada como

δ3+E[você1,2-você0 0,1|E=1,B=1]-E[você0 0,2-você0 0,1|E=1,UMA=1]-E[você0 0,2-você0 0,1|N=1,B=1]-E[você0 0,2-você0 0,1|N=-=1,UMA=1],
onde o primeiro índice subscreve o resultado potencial (1 tratado, 0 se não) e o segundo é o tempo (post é 2, pré é 1). Interpreto isso como dizendo que, desde que a mudança de não observáveis ​​ao longo do tempo para os idosos no estado tratado em comparação com os idosos em outros lugares seja semelhante à magnitude da mesma quantidade para os não idosos, o DDD identifica o efeito correto. Isso parece mais fraco que as tendências comuns, o que seria suficiente, mas não necessário para o DDD. Isso está correto?
Dimitriy V. Masterov
fonte

Respostas:

2
  1. Você está certo. Nesta apresentação de slides de 2011 , a equação (4), slide 6, mostra o termo ausente. Como você mencionou, a interpretação a ter em mente é que uma diferença tripla é uma diferença entre duas diferenças de diferenças.
  2. Você está certo ao mencionar que a estimativa exige que você omita uma categoria de referência para seus efeitos fixos de tempo, estado e faixa etária (para evitar colinearidade). No entanto, a escolha da categoria de referência não deve importar para o estimador do termo de diferença tripla. Observe que você pode escrever diretamente seus manequins como interações entre períodos de tempo, estados e faixas etárias; veja a equação nas notas de aula de Pischke (parte inferior da p.16).
  3. Uma maneira de estruturar a suposição de identificação é a seguinte. No DiD padrão, você gostaria que seus dois grupos tivessem evoluído de maneira semelhante se o tratamento não existisse. Na diferença tripla, você gostaria que a diferença entre o estado tratado e os estados evoluísse da mesma forma ao longo do tempo para indivíduos mais velhos e mais jovens, na ausência do tratamento. Você também pode enquadrar a mudança de estados e faixas etárias. A maneira como você empiricamente testaria isso seria primeiro observar as tendências antes do tratamento acontecer (se você tiver dados antes que eles aconteçam). Em um caso de DiD, você apenas plotaria a média tratada e de controle para cada ano antes do tratamento. No caso da diferença tripla, você pode fazer o mesmo com quatro linhas ou, mais convenientemente, plotar lacunas entre os estados tratado e controle, para cada faixa etária e ano,
Roland
fonte
1.) Apenas para esclarecer, acredito que a omissão é intencional. Esse quarto termo deve ser descartado, pois seu valor esperado é zero. Em palavras, por que o estado que não recebe tratamento observa um efeito diferencial na população idosa? 2.) Isso pode ser alcançado usando uma tendência de tempo linear e interagindo as variáveis ​​de tratamento com a tendência de tempo linear? O manequim de período de tempo é absolutamente necessário? 3.) Eu acho que você pode testar isso da mesma forma que você testa tendências paralelas. Coloque um conjunto de variáveis ​​de interação anteriores. Os testes t individuais devem fornecer insignificância.
JuliusBilly