Mesmo que essa pergunta já tenha uma resposta aceita, acho que ainda posso contribuir para isso. O livro de Koenker (2005) realmente não o levará muito longe porque os desenvolvimentos na regressão quantílica IV começaram a aumentar nessa época.
As técnicas iniciais de regressão quantílica IV incluem a estrutura da cadeia causal de Chesher (2003) , que foi desenvolvida na abordagem de desvios médios ponderados (WAD) por Ma e Koenker (2006) . Neste artigo, eles também introduzem a abordagem de controle variável. Uma idéia semelhante foi usada por Lee (2007), que derivou um estimador de regressão quantílica IV usando funções de controle.
Todos esses estimadores utilizam uma estrutura de erro triangular assumida, necessária para a identificação. O problema disso é que essa estrutura triangular é implausível para problemas de endogeneidade que surgem devido à simultaneidade. Por exemplo, você não pode usar esses estimadores para um problema de estimativa de demanda e oferta.
O estimador de Abadie, Angrist e Imbens (2002), mencionado por Dimitriy V. Masterov, assume que você tem uma variável endógena binária e um instrumento binário. Em geral, essa é uma estrutura muito restritiva, mas estende a abordagem LATE da regressão linear IV para regressões quantílicas. Isso é bom porque muitos pesquisadores, especialmente em economia, estão familiarizados com o conceito LATE e a interpretação dos coeficientes resultantes.
O artigo seminal de Chernozhukov e Hansen (2005) realmente deu início a essa literatura e esses dois caras fizeram muito trabalho nessa área. O estimador de regressão quantil IV (IVQR) fornece uma ligação natural ao estimador 2SLS no contexto quantil. Seu estimador é implementado via Matlab ou Ox, como Dimitriy apontou, mas você pode esquecer o artigo de Kwak (2010). Este documento nunca chegou ao diário Stata e também seu código não é executado corretamente. Suponho que ele abandonou este projeto.
Em vez disso, você deve considerar o estimador de equações de estimativa suavizada IVQR (SEE-IVQR) de Kaplan e Sun (2012). Este é um estimador recente, que é uma melhoria em relação ao estimador original do IVQR em termos de velocidade computacional (evita o oneroso algoritmo de busca de grade) e erro médio ao quadrado. O código do Matlab está disponívelaqui .
O artigo de Frölich e Melly (2010) é bom porque considera a diferença entre regressão quantílica condicional e incondicional. O problema com a regressão quantílica em geral é que, depois de incluir covariáveis em sua regressão, a interpretação muda. No OLS, você sempre pode passar da expectativa condicional para a incondicional através da lei das expectativas iteradas, mas para quantis isso não está disponível. Esse problema foi mostrado pela primeira vez por Firpo (2007) e Firpo et al. (2009). Ele usa uma função de influência centrada novamente para marginalizar os coeficientes condicionais de regressão quantílica, de modo que possam ser interpretados como os coeficientes OLS usuais. Para seu propósito, esse estimador não ajudará muito, pois permite apenas variáveis exógenas. Se você estiver interessado, Nicole Fortin disponibiliza o código Stata em seu site.
O estimador incondicional de regressão quantílica IV incondicional mais recente que conheço é de Powell (2013) . Seu estimador de regressão quantílica generalizada (IV) permite estimar os efeitos marginais do tratamento quantil na presença de endogeneidade. Em algum lugar do site da RAND, ele também disponibiliza seu código Stata, mas não consegui encontrá-lo agora. Desde que você solicitou: em um artigo anterior, ele implementou esse estimador no contexto de dados do painel (ver Powell, 2012 ). Esse estimador é ótimo porque, diferentemente de todos os métodos QR de dados de painel anteriores, esse estimador não se baseia em grandes assintóticos T (que você normalmente não possui, pelo menos não em dados microeconométricos).
Por último, mas não menos importante, uma variante mais exótica: o estimador IVQR censurado (CQIV) de Chernozhukov et al. (2011) permite cuidar de dados censurados - como o nome sugere. É uma extensão do artigo de Chernozhukov e Hong (2003) que não vinculo porque não é para o contexto IV. Esse estimador é computacionalmente pesado, mas se você tiver dados censurados e não houver outra maneira de contorná-los, esse é o caminho a seguir. Amanda Kowalski publicou o código Stata em seu site ou você pode baixá-lo em RePEc. Esse estimador (e, a propósito, também o IVQR e o SEE-IVQR) supõe que você tenha uma variável endógena contínua. Eu usei esses estimadores no contexto de regressões de ganhos em que a educação era minha variável endógena, que levava entre 18 a 20 valores, portanto não exatamente contínua. Mas, nos exercícios de simulação, sempre pude mostrar que isso não é um problema. No entanto, isso provavelmente depende do aplicativo; portanto, se você decidir usá-lo, verifique novamente.
O novo Manual de regressão quantílica possui dois excelentes capítulos sobre esses tópicos:
fonte