Provando o teorema tardio de Angrist e Imbens 1994

8

Assumindo que existem um instrumento binário Zi que pode ser utilizado para estimar o efeito da variável endógena Di sobre o resultado Yi . Suponha que o instrumento tenha um primeiro estágio significativo, seja designado aleatoriamente, atenda à restrição de exclusão e atenda à monotonicidade, conforme descrito em Angrist e Imbens (1994). http://www.jstor.org/discover/10.2307/2951620?uid=3738032&uid=2&uid=4&sid=21104754800073

Eles afirmam que a probabilidade de ser um complacente ( Ci ) é

Pr(Ci)=Pr(Di=1|Zi=1)Pr(Di=1Zi=0)
e diferença nos resultados potenciais para a subpopulação de compliers é
E(Yi1Yi0|Ci)=E(Yi|Zi=1)E(Yi|Zi=0)E(Di|Zi=1)E(Di|Zi=0)

Alguém pode esclarecer como conseguem essas duas expressões e, mais importante, como as combinam? Eu tento entender isso no artigo de seu diário, mas não consigo entender. Qualquer ajuda sobre isso seria muito apreciada.

user44903
fonte

Respostas:

5

Para a primeira parte, você declarou que possui um instrumento "válido". Isso implica para um tratamento binário e instrumento que é equivalente a P ( D i = 1 | Z i = 1 ) P ( D i = 1 | Z i = 0 )Cov(Di,Zi)0P(Di=1|Zi=1)P(Di=1|Zi=0), ou seja, o instrumento afeta se o tratamento é escolhido ou não. Essa observação, que também deve ser declarada no artigo de Angrist e Imbens, é fundamental para o restante de suas provas. Para a primeira etapa, eles assumem que , o que significa que o número de complementadores ( C i ) é maior que o de aduladores ( F i ).P(Di=1|Zi=1)>P(Di=1|Zi=0)Ci)Fi

Usando a restrição de exclusão (para cada { 0 ; 1 }, temos que Y i z = Y i 0 z = Y i 1 z , ou seja, o instrumento não tem efeito direto no resultado), você pode escrever a diferença em a proporção de compliers e desafiadores na população como z0;1Yiz=Yi0z=Yi1z ZiP(Fi)=0P(Ci)=P(Di=1|Zi=1)-P(Di=1|Zi=0).

P(Di=1|Zi=1)P(Di=1|Zi=0)=P(Di1=1|Zi=1)P(Di0=1|Zi=0)=P(Di1=1)P(Di0=0)=[P(Di1=1,Di0=0)+P(Di1=1,Di0=1)][P(Di1=0,Di0=1)+P(Di1=1,Di0=1)]=P(Ci)P(Fi)
onde o segundo passo usa a independência para se livrar do condicionamento em porque os resultados potenciais são independentes do instrumento. O terceiro passo usa a lei da probabilidade total. No último passo, você só precisa usar a monotonicidade, que pressupõe basicamente que não existem , então e você obtém ZiP(Fi)=0
P(Ci)=P(Di=1|Zi=1)P(Di=1|Zi=0).
Este seria o seu primeiro coeficiente de estágio em uma regressão 2SLS. O pressuposto da monotonicidade é crucial para isso e deve-se pensar bastante nas possíveis razões pelas quais ela pode ser violada (no entanto, a monotonicidade pode ser relaxada, veja, por exemplo, de Chaisemartin (2012) “Tudo que você precisa é ATRASO” ).

A segunda parte da prova segue um caminho semelhante. Para isso, lembre-se de que o status de tratamento observado é porque você não pode observar os dois resultados possíveis para o mesmo indivíduo. Dessa maneira, você pode relacionar o resultado observado com o resultado potencial, o status do tratamento e o instrumento como Na segunda parte da prova, faça a diferença no resultado esperado com o instrumento sendo ligado e ligado, e use a representação anterior dos resultados observados e a restrição de exclusão em o primeiro passo para obter: Y i = ( 1 - Z i ) ( 1 - D i ) Y i 00 + Z i ( 1 - D i ) Y i 10 + ( 1 - Z i ) D i Y i 01 +

Di=ZiDi1+(1Zi)Di0
E ( Y i | Z i = 1 ) - E ( Y i | Z i = 0 )
Yi=(1Zi)(1Di)Yi00+Zi(1Di)Yi10+(1Zi)DiYi01+ZiDiYi11
E(Yi|Zi=1)E(Yi|Zi=0)=E(Yi1Di+Yi0(1Di)|Zi=0)E(Yi1Di+Yi0(1Di)|Zi=1)=E(Yi1Di1+Yi0(1Di1)|Zi=1)E(Yi1Di0+Yi0(1Di0)|Zi=0)=E(Yi1Di1+Yi0(1Di1))E(Yi1Di0+Yi0(1Di0))=E((Yi1Yi0)(Di1Di0))=E(Yi1Yi0|Di1Di0=1)P(Di1Di0=1)E(Yi1Yi0|Di1Di0=1)P(Di1Di0=1)=E(Yi1Yi0|Ci)P(Ci)E(Yi1Yi0|Fi)P(Fi)=E(Yi1Yi0|Ci)P(Ci)

Agora, isso foi um pouco de trabalho, mas não é tão ruim se você souber os passos que precisa tomar. Para a segunda linha, use novamente a restrição de exclusão para escrever os possíveis estados de tratamento. Na terceira linha, use a independência para se livrar do condicionamento em como antes. Na quarta linha, você apenas considera os termos. A quinta linha usa a lei das expectativas iteradas. A última linha surge devido à suposição de monotonicidade, ou seja, . Então você só precisa dividir como último passo e chegar a ZiP(Fi)=0

E(Yi1Yi0|Ci)=E(Yi|Zi=1)E(Yi|Zi=0)P(Ci)=E(Yi|Zi=1)E(Yi|Zi=0)P(Di=1|Zi=1)P(Di=1|Zi=0)=E(Yi|Zi=1)E(Yi|Zi=0)E(Di|Zi=1)E(Di|Zi=0)
desde que e são binários. Isso deve mostrar como você combina as duas provas e como elas chegam à expressão final.DiZi
Andy
fonte
5

Existem quatro tipos de pessoas:

  1. Never Takers (NT): para ambos os valores de ZD=0
  2. Defiers (DF): quando e quandoD=0Z=1D=1Z=0
  3. Compliers (C): quando e quandoD=1Z=1D=0Z=0
  4. Sempre dos compradores (AT): para ambos os valores de .D=1Z

A fórmula para o estimador de Wald é:

ΔIV=E(Y|Z=1)E(Y|Z=0)Pr(D=1|Z=1)Pr(D=1|Z=0)

Usando nossos 4 grupos e as regras básicas de probabilidade, podemos reescrever as duas partes do numerador como: e

E(Y|Z=1)=E(Y1|AT)Pr(AT)+E(Y1|C)Pr(C)+E(Y0|DF)Pr(DF)+E(Y0|NT)Pr(NT)
E(Y|Z=0)=E(Y1|AT)Pr(AT)+E(Y0|C)Pr(C)+E(Y1|DF)Pr(DF)+E(Y0|NT)Pr(NT)

Os dois termos do denominador são: e

Pr(D=1|Z=1)=Pr(D=1|Z=1,AT)Pr(AT)+Pr(D=1|Z=1,C)Pr(C)=Pr(AT)+Pr(C)
Pr(D=1|Z=0)=Pr(D=1|Z=0,AT)Pr(AT)+Pr(D=1|Z=0,DF)Pr(DF)=Pr(AT)+Pr(DF)

O primeiro deles corresponde à sua primeira expressão.

Voltando à fórmula de Wald e inserindo-os, vemos que alguns desses termos se cancelam na subtração, deixando YieldIsso gera alguma percepção. O estimador Wald IV é uma média ponderada do efeito do tratamento nos complementadores e a negativa do efeito do tratamento nos desafiadores.

ΔIV=[E(Y1|C)Pr(C)+E(Y0|D)Pr(D)][E(Y0|C)Pr(C)+E(Y1|DF)Pr(DF)]Pr(C)Pr(DF).

Agora fazemos duas suposições. Primeiro, assumimos a monotonicidade, para que o instrumento possa apenas aumentar ou diminuir a probabilidade de participação. Isso significa que . A suposição de monotonicidade é equivalente a assumir um modelo de função de índice para o tratamento. A segunda suposição é que existem alguns complementadores, ou seja, . O comportamento de alguns indivíduos deve ser alterado pelo instrumento. Este deve ser o caso se o instrumento for relevante. Essas duas suposições produzemPr(DF)=0Pr(C)>0

ΔIV=E(Y1|C)Pr(C)E(Y0|C)Pr(C)Pr(C)=E(Y1|C)E(Y0|C)=LATE.
Dimitriy V. Masterov
fonte
+1, acho que as duas respostas se complementam muito bem. Este mostra mais a intuição do estimador Wald e onde as premissas vêm de em vez de apenas utilizá-los de forma puramente técnica
Andy