Variáveis ​​de instrumento e restrição de exclusão do ponto de vista da mediação

8

Estou tendo problemas para entender a restrição de exclusão em variáveis ​​instrumentais.

Entendo que o efeito do tratamento imparcial é , ondeYé o resultado,Sé o tratamento eZé o instrumento. Em outras palavras,B=ITTB=Cov(Y,Z)Cov(S,Z)YSZ .B=ITTCompliance Rate

No entanto, se eu pensar sobre isso em uma estrutura de mediação e aplicar a restrição de exclusão, isso faz cada vez menos sentido.

Em uma estrutura de mediação, ITT = efeito total, ou . Portanto, o efeito do tratamento imparcial é:Cov(S,Z)Cov(Y,S)+Cov(Y,Z|S)

, que reduz a:(Cov(S,Z)Cov(Y,S)+Cov(Y,Z|S))Cov(S,Z)

,Cov(Y,S)+Cov(Y,Z|S)Cov(S,Z)

de modo que a estimativa causal imparcial é o efeito do tratamento tendencioso + o efeito do instrumento ( .controllingforthetreatmentcompliancerate

No entanto, com a restrição de exclusão, não se supõe que haja um efeito do instrumento, uma vez que controlamos o tratamento.

Um exemplo, do exemplo da Vila Sésamo de Gelman. Primeiro, obtendo o efeito do tratamento imparcial via 2SLS:

fit.2s <- lm(regular ~ encour, data = df)
watched.hat <- fit.2s$fitted
fit.2b <- lm(postlet ~ watched.hat, data = df)
summary(fit.2b)

o que dá a resposta, 7.934.

E agora, dentro de uma estrutura SEM:

library(foreign)
library(lavaan)
mod  <-
'
regular ~ a*encour
postlet ~ b*regular + c*encour
ind := a*b
total := a*b + c
'
fit <- sem(mod, data = df)
summary(fit)

 Regressions:
               Estimate  Std.Err  Z-value  P(>|z|)
  regular ~                                           
encour     (a)    0.362    0.051    7.134    0.000

  postlet ~                                           
  regular    (b)   13.698    2.079    6.589    0.000
  encour     (c)   -2.089    1.802   -1.160    0.246


  Defined Parameters:
               Estimate  Std.Err  Z-value  P(>|z|)
  ind               4.965    1.026    4.840    0.000
  total             2.876    1.778    1.617    0.106

13,698 - 2,089 / 0,362 = 7,92

Portanto, a única razão pela qual o efeito do tratamento imparcial não é apenas o efeito tendencioso do tratamento é que ainda existe um efeito do instrumento no controle do tratamento, o que, de acordo com a restrição de exclusão, não deve ocorrer.

Estou faltando alguma coisa aqui?

sam
fonte

Respostas:

1

Você afirma corretamente que, de acordo com as premissas IV do estilo LATE, com um efeito causal do IV Z no tratamento S, instrumento exógeno e sem efeito direto no resultado Y, seu efeito do tratamento B de S em Y é identificado como

Cov(Y,Z)/Cov(S,Z)=ITT/ComplianceRate

Tão claramente,

ITT=Cov(Y,Z)

Cov(S,Z)Cov(Y,S)+Cov(Y,Z)

Você parece sugerir ainda que o IV e o Y não devem estar relacionados em uma regressão de Y no tratamento e no IV. Este não é o caso se o tratamento S for realmente endógeno. Então, é um colisor, pois é causado pelo IV e pelo termo de erro não observado de Y. O condicionamento no tratamento torna o IV e o termo de erro dependentes e, portanto, também o IV e Y. Portanto, você obtém um valor diferente de zero coeficiente de regressão, mesmo que a restrição de exclusão seja válida. Isso deve ficar muito claro se você desenhar o gráfico causal.

Se não fosse o caso, poderíamos realmente testar a restrição de exclusão, mas é claro que sabemos que geralmente não podemos testá-la! (Pelo menos não tão facilmente).

Julian Schuessler
fonte
Adicionei uma edição para esclarecer, mas, de uma perspectiva de mediação, a ITT é (Cov (S, Z) ⋅Cov (Y, S) + Cov (Y, Z | S)) / Cov (S, Z). Isso é verificável com o exemplo de Gelman: coef (resumo (lm (postlet ~ incentivo, dados = df))) ['encorajador',] ['Estimativa'] = 2,88. A partir da saída SEM, (Cov (S, Z) ovCov (Y, S) + Cov (Y, Z | S)) / Cov (S, Z) = 2,88 (a estimativa ao lado do total, que é a * b + c)
sam
Então, como também pode ser verdade que Cov (Y, Z) / Cov (S, Z) = ITT / ComplianceRate? Sua equação para a fórmula ITT e IV não pode ser verdadeira ao mesmo tempo. Com a restrição de exclusão, sua fórmula não é verdadeira.
Julian Schuessler
1
Observe também que "da perspectiva da mediação", a ITT é uma quantidade causal, portanto, precisa ser definida em resultados potenciais ou com o operador do-do, não como uma função do PDF de observável. Portanto, o ITT é definido como E (Y | do (Z)), por exemplo. Veja en.wikipedia.org/wiki/… .
Julian Schuessler
Como Cov (Y, Z) pode ser decomposto em (Cov (S, Z) ovCov (Y, S) + Cov (Y, Z | S)). Talvez esteja faltando alguma coisa aqui, mas esse é o meu ponto: a identificação do impacto causal depende da restrição de exclusão para ser falsa, ou assim parece.
26416 Sam
Eu editei minha resposta. Ainda não entendo completamente sua confusão. Você pode achar muito esclarecedor ler Pearl, Judéia. "Modelos lineares: um" microscópio "útil para análise causal." As ferramentas são extremamente fáceis e deixam claro como esse problema é simples.
Julian Schuessler