Qual é a maneira correta de especificar uma diferença no modelo de diferença com os dados do painel no nível individual?
Aqui está a configuração: Suponha que eu tenha dados de painel em nível individual incorporados nas cidades por vários anos e o tratamento varie no nível do ano da cidade. Formalmente, seja ser o resultado para o indivíduo i na cidade de e ano e ser um manequim para saber se a intervenção afetou cidade no ano . Um estimador de DiD típico, como o descrito em Bertrand et al (2004, p. 250), é baseado em um modelo OLS simples, com termos de efeito fixo para cidade e ano:
Mas esse estimador ignora a estrutura do painel em nível individual (ou seja, várias observações para cada indivíduo nas cidades)? Faz sentido estender esse modelo com um termo de efeito fixo de nível individual ? Muitos aplicativos DiD usam dados repetidos de seção transversal sem os dados do painel em nível individual.
Bertrand, Marianne, Esther Duflo e Sendhil Mullainathan. 2004. "Quanto devemos confiar nas estimativas das diferenças nas diferenças?" Quarterly Journal of Economics 119 (1): 249–75.
Respostas:
Um bom recurso da diferença entre diferenças (DiD) é que você não precisa de dados do painel para isso. Dado que o tratamento ocorre em algum tipo de nível de agregação (nas cidades dos seus casos), você só precisa amostrar indivíduos aleatórios das cidades antes e depois do tratamento. Isto permite estimar
Aqui está um exemplo de código que mostra que esse é o caso. Eu uso o Stata, mas você pode replicar isso no pacote estatístico de sua escolha. Os "indivíduos" aqui são, na verdade, países, mas ainda estão agrupados de acordo com algum indicador de tratamento.
Portanto, você vê que o coeficiente de DiD permanece o mesmo quando os efeitos fixos individuais são incluídos (
areg
é um dos comandos de estimativa de efeitos fixos disponíveis no Stata). Os erros padrão são um pouco mais rigorosos e nosso indicador de tratamento original foi absorvido pelos efeitos fixos individuais e, portanto, caiu na regressão.Em resposta ao comentário
, mencionei o exemplo de Pischke para mostrar quando as pessoas usam efeitos fixos individuais em vez de um indicador de grupo de tratamento. Sua configuração tem uma estrutura de grupo bem definida, de modo que a maneira como você escreveu seu modelo está perfeitamente bem. Os erros padrão devem ser agrupados no nível da cidade, ou seja, o nível de agregação em que o tratamento ocorre (eu não fiz isso no código de exemplo, mas nas configurações de DiD, os erros padrão precisam ser corrigidos, conforme demonstrado pelo artigo de Bertrand et al. )
Você ainda pode querer pensar em motores por outros motivos. Por exemplo, se o tratamento tiver um efeito duradouro (ou seja, ainda afeta o resultado, mesmo que o indivíduo tenha se mudado)
fonte
A resposta curta é que o uso de efeito fixo na unidade ou no nível do grupo tratado não altera a estimativa, apenas a inferência. Normalmente, o uso de efeito fixo da unidade absorverá mais variação e, portanto, você terá erros padrão menores.
O fato de as unidades estarem no mesmo grupo agregado não altera esse resultado (apenas altera a forma como você define o nível do grupo tratado e o fato de precisar de painel em vez de seções transversais repetidas).
Observe, no entanto, que a equivalência só é válida quando não há X covariável. Assim que você possui Xs, os resultados são diferentes, independentemente de você usar efeitos fixos por unidade ou grupo.
O exemplo abaixo compara os 3 estimadores, em dois casos, com e sem X. Os estimadores são:
Código:
fonte