Literatura sobre regressão quantílica IV

16

Nos últimos meses, li intensamente sobre a regressão quantílica em preparação para minha tese de mestrado neste verão. Especificamente, li a maior parte do livro de Roger Koenker em 2005 sobre o assunto. Agora, quero expandir esse conhecimento existente para técnicas de regressão quantílica que permitam variáveis ​​instrumentais (IV). Este parece ser um campo ativo de pesquisa que está crescendo em ritmo acelerado.

Talvez alguém possa me sugerir:

  • artigos ou outra literatura sobre regressão quantílica IV
  • uma breve visão geral dessas diferentes técnicas estatísticas
  • os prós e contras de diferentes técnicas

Eu estou procurando principalmente literatura para começar e ter uma boa visão geral do que está por aí. Portanto, o primeiro ponto é o mais importante. Seria bom ter o segundo e o terceiro! Também meu interesse reside principalmente nos métodos transversais, mas também os métodos de painel são bem-vindos.

Desde já, obrigado.

AlexH
fonte

Respostas:

24

Mesmo que essa pergunta já tenha uma resposta aceita, acho que ainda posso contribuir para isso. O livro de Koenker (2005) realmente não o levará muito longe porque os desenvolvimentos na regressão quantílica IV começaram a aumentar nessa época.

As técnicas iniciais de regressão quantílica IV incluem a estrutura da cadeia causal de Chesher (2003) , que foi desenvolvida na abordagem de desvios médios ponderados (WAD) por Ma e Koenker (2006) . Neste artigo, eles também introduzem a abordagem de controle variável. Uma idéia semelhante foi usada por Lee (2007), que derivou um estimador de regressão quantílica IV usando funções de controle.
Todos esses estimadores utilizam uma estrutura de erro triangular assumida, necessária para a identificação. O problema disso é que essa estrutura triangular é implausível para problemas de endogeneidade que surgem devido à simultaneidade. Por exemplo, você não pode usar esses estimadores para um problema de estimativa de demanda e oferta.

O estimador de Abadie, Angrist e Imbens (2002), mencionado por Dimitriy V. Masterov, assume que você tem uma variável endógena binária e um instrumento binário. Em geral, essa é uma estrutura muito restritiva, mas estende a abordagem LATE da regressão linear IV para regressões quantílicas. Isso é bom porque muitos pesquisadores, especialmente em economia, estão familiarizados com o conceito LATE e a interpretação dos coeficientes resultantes.

O artigo seminal de Chernozhukov e Hansen (2005) realmente deu início a essa literatura e esses dois caras fizeram muito trabalho nessa área. O estimador de regressão quantil IV (IVQR) fornece uma ligação natural ao estimador 2SLS no contexto quantil. Seu estimador é implementado via Matlab ou Ox, como Dimitriy apontou, mas você pode esquecer o artigo de Kwak (2010). Este documento nunca chegou ao diário Stata e também seu código não é executado corretamente. Suponho que ele abandonou este projeto.
Em vez disso, você deve considerar o estimador de equações de estimativa suavizada IVQR (SEE-IVQR) de Kaplan e Sun (2012). Este é um estimador recente, que é uma melhoria em relação ao estimador original do IVQR em termos de velocidade computacional (evita o oneroso algoritmo de busca de grade) e erro médio ao quadrado. O código do Matlab está disponívelaqui .

O artigo de Frölich e Melly (2010) é bom porque considera a diferença entre regressão quantílica condicional e incondicional. O problema com a regressão quantílica em geral é que, depois de incluir covariáveis ​​em sua regressão, a interpretação muda. No OLS, você sempre pode passar da expectativa condicional para a incondicional através da lei das expectativas iteradas, mas para quantis isso não está disponível. Esse problema foi mostrado pela primeira vez por Firpo (2007) e Firpo et al. (2009). Ele usa uma função de influência centrada novamente para marginalizar os coeficientes condicionais de regressão quantílica, de modo que possam ser interpretados como os coeficientes OLS usuais. Para seu propósito, esse estimador não ajudará muito, pois permite apenas variáveis ​​exógenas. Se você estiver interessado, Nicole Fortin disponibiliza o código Stata em seu site.

O estimador incondicional de regressão quantílica IV incondicional mais recente que conheço é de Powell (2013) . Seu estimador de regressão quantílica generalizada (IV) permite estimar os efeitos marginais do tratamento quantil na presença de endogeneidade. Em algum lugar do site da RAND, ele também disponibiliza seu código Stata, mas não consegui encontrá-lo agora. Desde que você solicitou: em um artigo anterior, ele implementou esse estimador no contexto de dados do painel (ver Powell, 2012 ). Esse estimador é ótimo porque, diferentemente de todos os métodos QR de dados de painel anteriores, esse estimador não se baseia em grandes assintóticos T (que você normalmente não possui, pelo menos não em dados microeconométricos).

Por último, mas não menos importante, uma variante mais exótica: o estimador IVQR censurado (CQIV) de Chernozhukov et al. (2011) permite cuidar de dados censurados - como o nome sugere. É uma extensão do artigo de Chernozhukov e Hong (2003) que não vinculo porque não é para o contexto IV. Esse estimador é computacionalmente pesado, mas se você tiver dados censurados e não houver outra maneira de contorná-los, esse é o caminho a seguir. Amanda Kowalski publicou o código Stata em seu site ou você pode baixá-lo em RePEc. Esse estimador (e, a propósito, também o IVQR e o SEE-IVQR) supõe que você tenha uma variável endógena contínua. Eu usei esses estimadores no contexto de regressões de ganhos em que a educação era minha variável endógena, que levava entre 18 a 20 valores, portanto não exatamente contínua. Mas, nos exercícios de simulação, sempre pude mostrar que isso não é um problema. No entanto, isso provavelmente depende do aplicativo; portanto, se você decidir usá-lo, verifique novamente.

Andy
fonte
Esta é uma resposta fantástica!
Dimitriy V. Masterov
2
Atualização breve e muito egocêntrica: a mencionada Kaplan e Sun (2012) foi publicada em 2017; links para os (acesso aberto) versões publicadas e aceites, juntamente com links para MATLAB e código R estão em faculty.missouri.edu/~kaplandm mais papel geral / code (permitindo séries temporais e dados em painel) estão chegando em breve (disponível por e-mail para agora) ... na verdade, achei a análise muito útil acima, enquanto revisava a introdução.
David M Kaplan