O que é uma variável instrumental?

36

Variáveis ​​instrumentais estão se tornando cada vez mais comuns em economia aplicada e estatística. Para os não iniciados, podemos ter algumas respostas não técnicas para as seguintes perguntas:

  1. O que é uma variável instrumental?
  2. Quando alguém iria querer empregar uma variável instrumental?
  3. Como alguém encontra ou escolhe uma variável instrumental?
Graham Cookson
fonte
4
Você não acha que o artigo da Wikipedia é suficiente?
11
Perguntas como essa requerem um tipo de resposta wiki / blog. Eu acho que as perguntas não devem exigir respostas tão longas.
Não tenho certeza de que a coisa certa a fazer é simplesmente ignorar esta pergunta e encaminhá-lo ao wiki - especialmente durante a versão beta, na qual estamos tentando criar o conteúdo do site. Talvez o solicitante de perguntas deva enviar cada uma dessas perguntas individualmente para que possam ser melhor abordadas.
23410 russellpierce
3
@mbq - o exemplo da Wikipedia dificilmente se qualifica como não técnico. É muito dependente de jargões e equações.
Rolando2
11
Tornou-se comum em economia em algum momento da década de 1980. Alguns bioestáticos também ouviram falar e o aplicam no contexto de modelos de erro de medição, onde os instrumentos são vistos estritamente como medidas adicionais disponíveis. Eles se qualificam como instrumentos dentro do contexto econométrico mais amplo: estão correlacionados com a variável de interesse e não estão correlacionados com seu erro de medição.
StasK 23/08

Respostas:

41

[O texto a seguir talvez pareça um pouco técnico por causa do uso de equações, mas ele se baseia principalmente nas tabelas de flechas para fornecer a intuição que requer apenas uma compreensão muito básica do OLS - portanto, não fique com repulsa.]

Suponha que você queira estimar o efeito causal de em y i dado pelo coeficiente estimado para β , mas por alguma razão, existe uma correlação entre sua variável explicativa e o termo de erro:xEuyEuβ

yEu=α+βxEu+ϵEucorr

Isso pode ter acontecido porque esquecemos de incluir uma variável importante que também se correlaciona com . Este problema é conhecido como viés de variável omitida e, em seguida, o seu β não vai lhe dar o efeito causal (ver aqui para mais detalhes). Este é um caso em que você deseja usar um instrumento, porque somente então poderá encontrar o verdadeiro efeito causal.xEuβ^

Um instrumento é uma variável nova que não está correlacionada com ε i , mas que se correlaciona bem com x i e que apenas influências y i através x i - por isso o nosso instrumento é o que é chamado de "exógena". É como neste gráfico aqui:zEuϵEuxEuyEuxEu

zEuxEuyEuϵEu

Então, como usamos essa nova variável?
Talvez você se lembre da ideia do tipo ANOVA por trás da regressão, onde você divide a variação total de uma variável dependente em um componente explicado e um inexplicado. Por exemplo, se você regredir seu no instrumento,xEu

xEuvariação total=uma+πzEuvariação explicada+ηEuvariação inexplicada

então você sabe que a variação explicada aqui é exógena à nossa equação original porque depende apenas da variável exógena . Então, nesse sentido, dividimos nosso x i -se em uma parte que podemos afirmar é certamente exógena (que é a parte que depende z i ) e alguma parte inexplicável η i que mantém todas as más variação que se correlaciona com ε i . Agora pegamos a parte exógena dessa regressão, chamamos de ^ x i ,zEuxEuzEuηEuϵEuxEu^

xEu=uma+πzEuboa variação=x^Eu+ηEuvariação ruim

e colocar este em nosso regressão original:

yEu=α+βx^Eu+ϵEu

Agora, uma vez x i não é mais correlacionado com ε i (lembre-se, nós "filtrados" esta parte de x i e deixou-o em η i ), podemos consistentemente estimar nossa β porque o instrumento tem nos ajudado a quebrar a correlação entre a variável explicativa e o erro. Essa foi uma maneira de aplicar variáveis ​​instrumentais. Este método é realmente chamado de 2 estágios mínimos quadrados, onde a nossa regressão de x i on z i é chamado de "primeira fase" e a última equação aqui é chamado de "segundo estágio".x^EuϵEuxEuηEuβxEuzEu

Em termos de nossa imagem original (I deixar de fora o para não fazer uma bagunça, mas lembre-se que ele está lá!), Em vez de tomar a rota direta, mas falho entre x i para y i demos um passo intermediário via x iϵEuxEuyEux^Eu

x^EuzEuxEuyEu

Graças a esse leve desvio de nosso caminho para o efeito causal, conseguimos estimar consistentemente usando o instrumento. O custo desse desvio é que os modelos de variáveis ​​instrumentais geralmente são menos precisos, o que significa que eles tendem a ter erros padrão maiores.β

Como encontramos instrumentos?
Essa não é uma pergunta fácil, porque você precisa explicar por que seu não estaria correlacionado com ϵ i - isso não pode ser testado formalmente porque o erro verdadeiro não é observado. O principal desafio é, portanto, apresentar algo que possa ser visto de maneira plausível como exógeno, como desastres naturais, mudanças nas políticas ou, às vezes, você pode até fazer um experimento aleatório. As outras respostas tiveram alguns exemplos muito bons para isso, então não vou repetir esta parte.zEuϵEu

Andy
fonte
10
+1 Estou finalmente agradecido por ler uma resposta detalhada em vez de uma lista de referências ou links.
whuber
11
xϵxxβ
βx^EuxEuxEuβ
Veja aqui: stats.stackexchange.com/questions/64279/… ou você pode fazer uma nova pergunta. Espero que isto ajude.
22417 Andy
@ user35734 não é consistente, mas assintoticamente consistente.
Vim 23/11
17

Como estatístico médico, sem conhecimento prévio de economia (etr) ics, lutei para entender as variáveis ​​instrumentais, pois muitas vezes lutava para seguir seus exemplos e não entendia sua terminologia bastante diferente (por exemplo, 'endogeneidade', 'forma reduzida ',' equação estrutural ',' variáveis ​​omitidas '). Aqui estão algumas referências que achei úteis (a primeira deve estar disponível gratuitamente, mas receio que as outras provavelmente exijam uma assinatura):

Eu também recomendaria o capítulo 4 de:

uma parada
fonte
7

Não técnico (geralmente é para isso que serve): Há momentos em que X não apenas causa Y, mas Y causa X também. Uma variável instrumental é um dispositivo que pode "limpar" esse relacionamento confuso e inconveniente, para que as melhores estimativas possam ser feitas do efeito de X em Y.

A variável instrumental é escolhida em virtude de seus relacionamentos: é uma causa de X, mas, além de agir através de X, não afeta Y. O instrumento (ou instrumentos) é usado no Estágio Um para calcular uma nova "versão" "de X, um que não é de forma alguma uma função de Y. Esse novo X" previsto "é então usado em um segundo estágio, em uma regressão mais padrão, para explicar / prever Y. Portanto, o termo regressão de mínimos quadrados em dois estágios .

Geralmente, a IV é encontrada em processos que estão substituindo ou fora do controle de X OU Y, como variáveis ​​que dependem de leis, políticas, atos da natureza etc.

rolando2
fonte