Variáveis instrumentais estão se tornando cada vez mais comuns em economia aplicada e estatística. Para os não iniciados, podemos ter algumas respostas não técnicas para as seguintes perguntas:
- O que é uma variável instrumental?
- Quando alguém iria querer empregar uma variável instrumental?
- Como alguém encontra ou escolhe uma variável instrumental?
regression
econometrics
instrumental-variables
Graham Cookson
fonte
fonte
Respostas:
[O texto a seguir talvez pareça um pouco técnico por causa do uso de equações, mas ele se baseia principalmente nas tabelas de flechas para fornecer a intuição que requer apenas uma compreensão muito básica do OLS - portanto, não fique com repulsa.]
Suponha que você queira estimar o efeito causal de em y i dado pelo coeficiente estimado para β , mas por alguma razão, existe uma correlação entre sua variável explicativa e o termo de erro:xi yi β
Isso pode ter acontecido porque esquecemos de incluir uma variável importante que também se correlaciona com . Este problema é conhecido como viés de variável omitida e, em seguida, o seu β não vai lhe dar o efeito causal (ver aqui para mais detalhes). Este é um caso em que você deseja usar um instrumento, porque somente então poderá encontrar o verdadeiro efeito causal.xi βˆ
Um instrumento é uma variável nova que não está correlacionada com ε i , mas que se correlaciona bem com x i e que apenas influências y i através x i - por isso o nosso instrumento é o que é chamado de "exógena". É como neste gráfico aqui:zEu ϵEu xEu yEu xEu
Então, como usamos essa nova variável?xEu
Talvez você se lembre da ideia do tipo ANOVA por trás da regressão, onde você divide a variação total de uma variável dependente em um componente explicado e um inexplicado. Por exemplo, se você regredir seu no instrumento,
então você sabe que a variação explicada aqui é exógena à nossa equação original porque depende apenas da variável exógena . Então, nesse sentido, dividimos nosso x i -se em uma parte que podemos afirmar é certamente exógena (que é a parte que depende z i ) e alguma parte inexplicável η i que mantém todas as más variação que se correlaciona com ε i . Agora pegamos a parte exógena dessa regressão, chamamos de ^ x i ,zEu xEu zEu ηEu ϵEu xEuˆ
e colocar este em nosso regressão original:
Agora, uma vez x i não é mais correlacionado com ε i (lembre-se, nós "filtrados" esta parte de x i e deixou-o em η i ), podemos consistentemente estimar nossa β porque o instrumento tem nos ajudado a quebrar a correlação entre a variável explicativa e o erro. Essa foi uma maneira de aplicar variáveis instrumentais. Este método é realmente chamado de 2 estágios mínimos quadrados, onde a nossa regressão de x i on z i é chamado de "primeira fase" e a última equação aqui é chamado de "segundo estágio".xˆEu ϵEu xEu ηEu β xEu zEu
Em termos de nossa imagem original (I deixar de fora o para não fazer uma bagunça, mas lembre-se que ele está lá!), Em vez de tomar a rota direta, mas falho entre x i para y i demos um passo intermediário via x iϵEu xEu yEu xˆEu
Graças a esse leve desvio de nosso caminho para o efeito causal, conseguimos estimar consistentemente usando o instrumento. O custo desse desvio é que os modelos de variáveis instrumentais geralmente são menos precisos, o que significa que eles tendem a ter erros padrão maiores.β
Como encontramos instrumentos?zEu ϵEu
Essa não é uma pergunta fácil, porque você precisa explicar por que seu não estaria correlacionado com ϵ i - isso não pode ser testado formalmente porque o erro verdadeiro não é observado. O principal desafio é, portanto, apresentar algo que possa ser visto de maneira plausível como exógeno, como desastres naturais, mudanças nas políticas ou, às vezes, você pode até fazer um experimento aleatório. As outras respostas tiveram alguns exemplos muito bons para isso, então não vou repetir esta parte.
fonte
Como estatístico médico, sem conhecimento prévio de economia (etr) ics, lutei para entender as variáveis instrumentais, pois muitas vezes lutava para seguir seus exemplos e não entendia sua terminologia bastante diferente (por exemplo, 'endogeneidade', 'forma reduzida ',' equação estrutural ',' variáveis omitidas '). Aqui estão algumas referências que achei úteis (a primeira deve estar disponível gratuitamente, mas receio que as outras provavelmente exijam uma assinatura):
Staiger D. Variáveis Instrumentais. Seminário de Cyber da AcademyHealth em Métodos de Pesquisa em Serviços de Saúde, março de 2002. http://www.dartmouth.edu/~dstaiger/wpapers-Econ.htm
Newhouse JP, McClellan M. Econometria na pesquisa de resultados: o uso de variáveis instrumentais. Revisão Anual da Saúde Pública 1998; 19: 17-34. http://dx.doi.org/10.1146/annurev.publhealth.19.1.17
Gronelândia S. Uma introdução às variáveis instrumentais para epidemiologistas. International Journal of Epidemiology 2000; 29: 722-729. http://dx.doi.org/10.1093/ije/29.4.722
Zohoori N, Savitz DA. Abordagens econométricas para dados epidemiológicos: relacionando endogeneidade e heterogeneidade não observada a confusão. Annals of Epidemiology 1997; 7: 251-257. http://dx.doi.org/10.1016/S1047-2797(97)00023-9
Eu também recomendaria o capítulo 4 de:
fonte
Aqui estão alguns slides que eu preparei para um curso de econometria na UC Berkeley. Espero que você os ache úteis - acredito que eles respondem às suas perguntas e fornecem alguns exemplos.
Também existem tratamentos mais avançados nas páginas do curso para PS 236 e PS 239 (cursos de métodos de ciências políticas em nível de pós-graduação) no meu site: http://gibbons.bio/teaching.html .
Charlie
fonte
Não técnico (geralmente é para isso que serve): Há momentos em que X não apenas causa Y, mas Y causa X também. Uma variável instrumental é um dispositivo que pode "limpar" esse relacionamento confuso e inconveniente, para que as melhores estimativas possam ser feitas do efeito de X em Y.
A variável instrumental é escolhida em virtude de seus relacionamentos: é uma causa de X, mas, além de agir através de X, não afeta Y. O instrumento (ou instrumentos) é usado no Estágio Um para calcular uma nova "versão" "de X, um que não é de forma alguma uma função de Y. Esse novo X" previsto "é então usado em um segundo estágio, em uma regressão mais padrão, para explicar / prever Y. Portanto, o termo regressão de mínimos quadrados em dois estágios .
Geralmente, a IV é encontrada em processos que estão substituindo ou fora do controle de X OU Y, como variáveis que dependem de leis, políticas, atos da natureza etc.
fonte