Definição de validade de uma variável instrumental

8

O que significa "validade de um instrumento" exatamente?

No meu curso de econometria, acabamos de definir a validade do instrumento como , onde Z é a variável instrumental e uE[Z|você]=0 0Zvocê é o termo de erro de um modelo de regressão univariado. Depois, também falamos sobre a força de um instrumento, mas tenho certeza de que entendi corretamente que é um requisito diferente da validade.

Em aplicações, muitas vezes eu encontrar a definição de validade como , onde Z é o instrumento e X é a variável explicativa endógena, mais a exigência de que os E [ Z | u ] = 0 (como acima), que geralmente é definido como restrição de exclusão.corr(Z,X)0 0ZXE[Z|você]=0 0

Estou um pouco confuso e não é tão fácil encontrar o tipo de cartilha sobre abordagens intravenosas de que preciso. Alguém pode resolver esses problemas?

Doutoramento
fonte
Essa pergunta pode ser mais adequada ao site de Economia do Stack Exchange.
Mike Hunter
4
@ Johnson, acho que isso poderia ser também. Compreender as variáveis ​​instrumentais é um tópico estatístico. Quando uma pergunta pode estar no tópico em mais de um site, normalmente adiro à escolha do OP.
gung - Restabelece Monica
@DJohnson Eu acho que é apropriado para a CV: a estimativa IV certamente não se restringe à economia / econometria na aplicação (embora a técnica tenha se originado na disciplina de econometria). Artigos e livros didáticos de epidemiologia, como o que citei na minha resposta (e consigo pensar em outras pessoas de cabeça para baixo), abordam os métodos de estimativa IV e identificação de variáveis ​​IV.
Alexis

Respostas:

6

Os requisitos para que Z seja um instrumento válido para X são:

  • Relevância = Z precisa estar altamente correlacionado com X
  • Exógeno = Z está correlacionado com Y somente através de sua correlação com X; então Z não está correlacionado com o erro na equação do resultado

A idéia principal por trás de IV é que, quando Z muda, ele também deve alterar X, mas não a parte problemática de X que está correlacionada com o erro. Para obter o efeito de X em Y, estamos usando apenas parte da variação em X, a parte que é impulsionada pela variação em Z.

Dimitriy V. Masterov
fonte
Esta é uma boa explicação para os leigos sobre o que a estimativa IV faz: "mas não a parte problemática de X que está correlacionada com o erro". Há um pequeno vídeo engraçado (OK, não tão pequeno, com 30 minutos de duração) de Antonakis no YouTube sobre endogeneidade, onde é representado como um ser de miasma irregular para dar ênfase adicional à sua natureza problemática!
Marquês de Carabas
1
altamente é uma palavra muito forte. precisa estar correlacionado com X , com a ressalva de que, se o relacionamento for muito fraco, você provavelmente encontrará problemas conhecidos associados a instrumentos fracos. ZX
Matthew Gunn
@MatthewGunn Eu não especifiquei um limite exato, o que é muito grande para quem vê. O artigo de Staiger e Stock, de 97, Econometrica argumenta que o viés de amostra finita (em direção ao limite da OLS) é proporcional à estatística F do primeiro estágio, portanto, maior é sempre melhor em minha mente.
Dimitriy V. Masterov 25/05
Concordou que "altamente" é um daqueles termos abertos à interpretação e que maior correlação é melhor. Para citar os Rolling Stones, "você nem sempre consegue o que deseja, mas se você tentar algum dia, poderá encontrar, consegue o que precisa". : P Eu escreveria pessoalmente " está suficientemente correlacionado com X : estimativas baseadas em instrumentos fracos podem exibir um viés amostral finito significativo". ZX
Matthew Gunn
1
@ user001 Não, esta suposição não é verificável. A insignificância nessa especificação diz muito pouco.
Dimitriy V. Masterov 26/12/18
8

Após a inferência causal de Hernán e Robins , capítulo 16: Estimativa de variáveis ​​instrumentais, as variáveis ​​instrumentais têm quatro pressupostos / requisitos:

  1. deve serassociadocom X .ZX

  2. deve afetar causalmente Y somenteatravés de XZY X

  3. Não deve haver quaisquer causas anteriores de ambos e Z .YZ

  4. O efeito de em Y deve ser homogêneo. Essa suposição / requisito tem duas formas, fraca e forte :XY

    • Fraca homogeneidade do efeito de em Y : O efeito de X em Y não varia de acordo com os níveis de Z (ou seja, Z não pode modificar o efeito de X em Y ).XYXYZZXY
    • Forte homogeneidade do efeito de em Y : O efeito de X em Y é constante em todos os indivíduos (ou seja qual for a sua unidade de análise).XYXY

Instrumentos que não atendem a essas premissas geralmente são inválidos. (2) e (3) são geralmente difíceis de fornecer fortes evidências para (daí suposições ).

A versão forte da condição (4) pode ser uma suposição muito irracional, dependendo da natureza dos fenômenos que estão sendo estudados (por exemplo, os efeitos dos medicamentos na saúde dos indivíduos geralmente variam de indivíduo para indivíduo). A versão fraca da condição (4) pode exigir o uso de estimadores atípicos de IV, dependendo da circunstância.

A fraqueza do efeito de em X realmente não tem uma definição formal. Certamente a estimativa IV produz resultados tendenciosos quando o efeito de Z em X é pequeno em relação ao efeito de U (fator de confusão não medido) em XZXZXvocêX , mas não há um ponto difícil e rápido, e o viés depende do tamanho da amostra. Hernán e Robins são (respeitosa e construtivamente) críticos da utilidade da regressão IV em relação às estimativas baseadas no raciocínio causal formal de sua abordagem (ou seja, a abordagem do raciocínio causal formal das pessoas de causalidade contrafactual como Pearl, etc.).

Hernán, MA e Robins, JM (2017). Inferência Causal . Chapman & Hall / CRC.

Alexis
fonte
Como você pode fazer referência e citar este livro? Segundo a Amazon, não será publicado até dezembro deste ano.
Mike Hunter
1
@DJohnson Siga meu link (eles disponibilizam os PDFs de pré-impressão). ;) Além disso, eu participei da aula deles há 15 anos e eles a estavam dissecando ainda.
Alexis
@Alexis Qual é a intuição sobre por que você precisa de homogeneidade?
Dimitriy V. Masterov 25/05
XY
0

Ambas as suposições podem ser vistas olhando para o sistema de equações:

x=γ1+γ2z+ϵy=β1+β2x+γ3z+você
  • γ20 0R2

  • γ3=0 0zy

γ3=0 0

Matifou
fonte
1
O problema com relação à força do instrumento é que "alto o suficiente" realmente não tem uma definição formal.
Alexis