Como representar corretamente as variáveis de diferença nos DAGs?

Se estou interessado nos efeitos causais da mudança de uma variável ( ) em algum resultado ( ), como eu representaria isso em um gráfico acíclico direcionado (DAG)? $E$ $O$

Suponha que $\Delta E_2 = E_2 - E_1$ , onde $E_1$ e $E_2$ ocorram nos momentos 1 e 2, o DAG correto seria:

1. Assumindo que $\Delta E_2$ é simplesmente capturado por todos os níveis de $E_1$ e $E_2$ ( a la os efeitos de interação mesma forma são tão capturados)?

DAG 1: E_1 e E_2 causam O

2. Supondo que $\Delta E_2$ é uma variável causalmente distinta de $E_1$ e $E_2$ , mas requer a presença dessas variáveis?

DAG 2: E_1, E_2 e Delta E causam O

3. Supondo que $\Delta E_2$ seja independente de $E_1$ e $E_2$ e este último não seja necessário para representar os efeitos de $\Delta E_2$ ?

DAG 3: Delta E causa O

Algo mais?

NOTA: " DAG " não significa "qualquer tipo antigo de gráfico causal ou correlacional", mas é um formalismo rigorosamente proscrito que representa crenças causais.

Minha motivação é que estou tentando pensar na representação DAG de modelos dinâmicos, como o modelo de correção de erros generalizado:

Δ O_{t} = β_{0 0} + β_{c} (O_{t - 1} - E_{t - 1}) + β_{Δ E} Δ E_{t} + β_{E} E_{t - 1} + ε_{t}

$\Delta O_t = \beta_{0} + \beta_{\text{c}}\left(O_{t-1} - E_{t-1}\right) + \beta_{\Delta E}\Delta E_{t} + \beta_E E_{t-1} + \varepsilon_t$

Obviamente, a estimativa bruta dos parâmetros é transformada para interpretar o modelo como abaixo, então talvez o DAG do modelo acima seja ainda mais confuso?

Efeito instantâneo de curto prazo da alteração em em : $E$ $\Delta O$ $\beta_{\Delta E}$

Efeito retardado de curto prazo do nível de em : $E$ $\Delta O$ $\beta_{E} - \beta_{\text{c}} - \beta_{\Delta E}$

Efeito de equilíbrio de longo prazo de defasado em : $E$ $\Delta O$ $\frac{\beta_{\text{c}} - \beta_{E}}{\beta_{\text{c}}}$

time-series dag Alexis
fonte

Respostas:

A solução é pensar funcionalmente.

O valor de mais especificamente . Portanto, variáveis de diferença podem ser representadas nos DAGs pela opção 4, "outra coisa" (este DAG assume e diretamente causam , além da diferença): $\Delta E_{2} = f(E_{1},E_{2})$ $\Delta E_{2} = E_{2} - E_{1}$ $E_{1}$ $E_{2}$ $O$

DAG da variável diferença com efeitos diretos das variáveis pai

Se e não tiverem efeitos diretos em , continuará sendo uma função de seus pais: $E_{1}$ $E_{2}$ $O$ $\Delta E_{2}$

DAG de uma variável de diferença sem efeitos diretos de variáveis pai

Se reescrevermos o modelo de correção de erro generalizado de atraso único ( para 'termo eQuilibrium', onde ): $Q_{t-1}$ $Q_{t-1} = O_{t-1} - E_{t-1}$

Δ O_{t} = β_{0 0} + β_{c} (Q_{t - 1}) + β_{Δ E} Δ E_{t} + β_{E} E_{t - 1} + ε_{t}

$\Delta O_t = \beta_{0} + \beta_{\text{c}}\left(Q_{t-1}\right) + \beta_{\Delta E}\Delta E_{t} + \beta_E E_{t-1} + \varepsilon_t$

Em seguida, o DAG subjacente ao modelo para (ignorando seus descendentes em ) é: $\Delta O_{t}$ $t+1$

Segmento de aDAG no tempo t para um modelo de correção de erros generalizado

Os efeitos de em do modelo entram assim no termo de equilíbrio , em e no termo de mudança . Outras causas de , , e (por exemplo, variáveis não modeladas, entradas aleatórias) são deixadas implícitas. $E$ $\Delta O_{t}$ $Q_{t-1}$ $E_{t-1}$ $\Delta E_{t}$ $O_{t-1}$ $O_{t}$ $E_{t-1}$ $E_{t}$

A parte desta resposta correspondente aos dois primeiros DAGs é cortesia da comunicação pessoal com Miguel Hernán.

Alexis
fonte

EDITAR:

Se você está preocupado apenas em representar relacionamentos não paramétricos entre suas variáveis, acho que 1) seria o mais apropriado. Embora possa haver uma forma funcional mais específica relacionando as duas variáveis ao resultado, em um DAG, não é necessário representar essa forma. Por outro lado, se você quiser usar um diagrama de caminhos representando um modelo de equação estrutural linear como o que você escreveu, faria sentido incluir a pontuação da diferença no diagrama; Dessa forma, o modelo específico que você escreveu e o diagrama seriam igualmente específicos. Um DAG é mais vago (mas também mais flexível), pois não requer (ou permite) a forma específica da função.

Isso pode se resumir ao objetivo de desenhar seu DAG. Se seu objetivo é representar com o máximo de precisão possível os relacionamentos entre suas variáveis, faria sentido incluir o termo de diferença como sua própria variável, pois ele possui sua própria força causal. Um gráfico sem ele também seria válido. Em teoria, você poderia fazer as mesmas declarações de independência condicional sobre o resultado e os preditores com um DAG mais detalhado do que com um DAG menos detalhado.

Minha intuição está mais próxima de 3). Se é verdade que e não afetam diretamente exceto pela diferença, 3) está correto, e eu adicionaria arestas de e a e de a para completar. Nenhum outro nó apontaria para a variável de diferença, mas as variáveis que preveem a diferença apontariam para e / ou . Graficamente, o que estou descrevendo é: $E_1$ $E_2$ $O$ $E_1$ $E_2$ $\Delta E_2$ $E_1$ $E_2$ $E_1$ $E_2$

E1
 |---->  E2-E1 ---> O
 V       ^
E2-------|

com possíveis setas adicionais de e a se eles afetarem além do efeito causado pela diferença. $E_1$ $E_2$ $O$ $O$

Noé
fonte

"Se é verdade que E1 e E2 não afetam diretamente O, exceto pela diferença", você parece estar ignorando o modelo que especifiquei.

Alexis

Segunda preocupação. A variável de interação é puramente uma função de e ; no entanto, essa variável não seria representada porque você desenhou o DAG em sua resposta , portanto é não está absolutamente claro para mim que, mesmo se eu estivesse interessado no modelo seu DAG estaria correto.

E_{1} \times E_{2}

$E_{1}\times E_{2}$

E_{1}

$E_{1}$

E_{2}

$E_{2}$

Δ O = β_{0} + Δ E_{2} + ε

$\Delta O = \beta_{0} + \Delta E_{2} + \varepsilon$

Alexis #

Essas são boas preocupações. Eu estava ignorando o modelo que você especificou e focando na sua pergunta. Você deseja especificar um diagrama de caminho representando um modelo de equação estrutural linear ou um DAG não paramétrico? No primeiro caso, convém incluir o termo de diferença como sua própria variável. Caso contrário, como você mencionou, seria apropriado não fazê-lo (exatamente como seria com uma interação). Vou revisar minha resposta.

Noah

A questão não tem nada a ver com SEMs. Você pode perceber porque o SEM não aparece na pergunta, mesmo como uma tag. :) Por outro lado, minha pergunta é sobre DAGs. :) Além disso: em relação ao meu segundo comentário "nada claro" não significa que você não esteja correto ... apenas significa que preciso persuadir sobre os formalismos do DAG.

Alexis

Minha resposta provavelmente não é muito persuasiva, mas espero que outra pessoa possa fazer um trabalho melhor. O modelo que você escreveu é um SEM linear, portanto, embora você não tenha perguntado especificamente sobre isso, se você está tentando relacionar algum tipo de diagrama de caminho com os termos de um modelo, está se aventurando no território do diagrama de caminho SEM.

Noah

Como representar corretamente as variáveis ​​de diferença nos DAGs?

Respostas:

Como representar corretamente as variáveis de diferença nos DAGs?