Como interpretar o coeficiente de segundo estágio na regressão de variáveis ​​instrumentais com um instrumento binário e uma variável endógena binária?

11

(postagem bastante longa, desculpe. Inclui muitas informações de plano de fundo, fique à vontade para pular para a pergunta na parte inferior.)

Introdução: Estou trabalhando em um projeto em que estamos tentando identificar o efeito de uma variável endógena binária, , em um resultado contínuo, . Criamos um instrumento, , que acreditamos ser atribuído aleatoriamente.x1yz1

Dados: Os dados em si estão em uma estrutura de painel com cerca de 34.000 observações espalhadas por 1000 unidades e cerca de 56 períodos de tempo. assume um valor de 1 para cerca de 700 (2%) das observações e faz isso para cerca de 3000 (9%). 111 (0,33%) observações pontuam 1 em e em , e é duas vezes mais provável que uma observação marque 1 em se também marcar 1 em .x1z1z1x1x1z1

Estimativa: Estimamos o seguinte modelo 2SLS através do procedimento ivreg2 da Stata:

x1=π0+π1z1+Zπ+v
y=β0+β1x1+Zβ+u

Onde é um vetor de outras variáveis ​​exógenas, é o valor previsto de desde o primeiro estágio e e são termos de erro.Zx1x1uv

Resultados: tudo parece estar funcionando bem; a estimativa de é altamente significativa no primeiro estágio e a estimativa de é altamente significativa no segundo estágio. Todos os sinais são como o esperado, incluindo os das outras variáveis ​​exógenas. O problema é, no entanto, que a estimativa de - o coeficiente de interesse - é implausível grande (ou, pelo menos, de acordo com a maneira como a interpretamos).π1β1β1

y varia de 2 a 26, com média e mediana de 17, mas a estimativa de varia de 30 a 40 (dependendo da especificação)!β1

Fraco IV: Nosso primeiro pensamento foi que isso se devia ao fato de o instrumento ser muito fraco; isto é, não se correlaciona muito com a variável endógena, mas isso realmente não parece ser o caso. Para inspecionar a fraqueza do instrumento, usamos o pacote fraco de Finlay, Magnusson e Schaffer, pois ele fornece testes que são robustos a violações da suposição (que é relevante aqui, pois temos dados em painel e agrupamos nossos SEs em o nível da unidade).i.i.d.

De acordo com o teste de AR, o limite inferior do intervalo de confiança de 95% para o coeficiente do segundo estágio está entre 16 e 29 (novamente dependendo da especificação). A probabilidade de rejeição é praticamente 1 para todos os valores próximos a zero.

Observações influentes: tentamos estimar o modelo com cada unidade removida individualmente, com cada observação removida individualmente e com grupos de unidades removidos. Nenhuma mudança real.

Solução proposta: alguém propôs que não devemos resumir o efeito estimado do instrumentado em sua métrica original (0-1), mas na métrica de sua versão prevista. varia de -0,01 a 0,1 com média e mediana de cerca de 0,02 e um DP de cerca de 0,018. Se fôssemos resumir o efeito estimado de , digamos, com um aumento de um DP em , isso seria (outras especificações dão resultados quase idênticos). Isso seria bem mais razoável (ainda assim substancial). Parece a solução perfeita. Exceto que eu nunca vi alguém fazer isso; todo mundo parece interpretar o coeficiente do segundo estágio usando a métrica da variável endógena original.x1x1x1x10.01830=0.54

Pergunta: Em um modelo IV, é correto resumir o efeito estimado (o LATE, na verdade) de um aumento na variável endógena usando a métrica da versão prevista dela? No nosso caso, essa métrica é probabilidade prevista.

Nota: Usamos 2SLS mesmo que tenhamos uma variável endógena binária (tornando o primeiro estágio um LPM). Angrist & Krueger (2001): “Variáveis ​​instrumentais e a busca por identificação: da oferta e demanda a experiências naturais”) Também tentamos o procedimento de três estágios usado em Adams, Almeida e Ferreira (2009): “ Entendendo a relação entre fundador-CEOs e desempenho da empresa ”. A última abordagem, que consiste em um modelo probit seguido por 2SLS, produz coeficientes menores e mais sensíveis, mas eles ainda são muito grandes se interpretados na métrica 0-1 (cerca de 9-10). Obtemos os mesmos resultados com cálculos manuais que com a opção probit-2sls-no ivtreatreg de Cerulli.

Bertel
fonte
Você já tentou etregress/treatreg?
Dimitriy V. Masterov
Oi Dimitriy, obrigado pela resposta! Eu tentei regressar agora, e isso dá resultados um pouco semelhantes. No entanto, lendo o manual Stata e Wooldridge (2002): "Análise econométrica de seção transversal e dados de painel", tenho a impressão de que esse tipo de modelo de regressão ao tratamento assume ignorância no tratamento. Ou seja, dependendo das variáveis ​​observadas, se uma unidade é tratada ou não, é independente de seu resultado (potencial) sob tratamento e controle.
Bertel
(cont.) Em nossos dados, não podemos realmente sustentar essa suposição; nós apenas temos uma fonte de variação aleatória em . Portanto, IV parece a opção apropriada. Se eu tenho as suposições certas, de qualquer maneira. x
Bertel
Seria realmente útil ter alguns gráficos, por exemplo, gráficos de dispersão ou gráficos de densidade do kernel das variáveis ​​variáveis ​​e resíduos, etc. Lembre-se que plim , mesmo uma pequena correlação entre o instrumento e o termo do erro pode causar uma estimativa inconsistente forte de ! β^1=β1+Cov(z1,u)Cov(z1,x1)β1
Arne Jonas Warnke

Respostas:

2

Essa é uma pergunta antiga, mas para quem se deparar com ela no futuro, intuitivamente, a estimativa 2SLS de é da regressão "forma reduzida"β1α1

y=α0+α1z1+Zα+u

dividido por partir da regressão "primeiro estágio"π1

x1=π0+π1z1+Zπ+v

Portanto, se as estimativas 2SLS de forem "implausivelmente grandes", verifique as estimativas OLS de e .β1α1π1

Se as estimativas forem "razoáveis", o problema pode ser que as estimativas sejam "muito pequenas". Dividir por um " muito pequeno" pode produzir um "implausivelmente grande" .α1π1α^1π^1β^1

Peter
fonte