Como representar corretamente as variáveis ​​de diferença nos DAGs?

8

Se estou interessado nos efeitos causais da mudança de uma variável ( ) em algum resultado ( ), como eu representaria isso em um gráfico acíclico direcionado (DAG)?EO

Suponha que ΔE2=E2-E1 , onde E1 e E2 ocorram nos momentos 1 e 2, o DAG correto seria:

1. Assumindo que ΔE2 é simplesmente capturado por todos os níveis de E1 e E2 ( a la os efeitos de interação mesma forma são tão capturados)?



2. Supondo que ΔE2 é uma variável causalmente distinta de E1 e E2 , mas requer a presença dessas variáveis?



3. Supondo que ΔE2 seja independente de E1 e E2 e este último não seja necessário para representar os efeitos de ΔE2 ?


  1. Algo mais?

NOTA: " DAG " não significa "qualquer tipo antigo de gráfico causal ou correlacional", mas é um formalismo rigorosamente proscrito que representa crenças causais.


Minha motivação é que estou tentando pensar na representação DAG de modelos dinâmicos, como o modelo de correção de erros generalizado:

ΔOt=β0 0+βc(Ot-1-Et-1)+βΔEΔEt+βEEt-1+εt

Obviamente, a estimativa bruta dos parâmetros é transformada para interpretar o modelo como abaixo, então talvez o DAG do modelo acima seja ainda mais confuso?

Efeito instantâneo de curto prazo da alteração em em :EΔOβΔE

Efeito retardado de curto prazo do nível de em :EΔOβE-βc-βΔE

Efeito de equilíbrio de longo prazo de defasado em :EΔOβc-βEβc

Alexis
fonte

Respostas:

4

A solução é pensar funcionalmente.

O valor de mais especificamente . Portanto, variáveis ​​de diferença podem ser representadas nos DAGs pela opção 4, "outra coisa" (este DAG assume e diretamente causam , além da diferença):ΔE2=f(E1,E2)ΔE2=E2E1E1E2O

Se e não tiverem efeitos diretos em , continuará sendo uma função de seus pais:E1E2OΔE2

Se reescrevermos o modelo de correção de erro generalizado de atraso único ( para 'termo eQuilibrium', onde ):Qt-1Qt-1=Ot-1-Et-1

ΔOt=β0 0+βc(Qt-1)+βΔEΔEt+βEEt-1+εt

Em seguida, o DAG subjacente ao modelo para (ignorando seus descendentes em ) é:ΔOtt+1

Os efeitos de em do modelo entram assim no termo de equilíbrio , em e no termo de mudança . Outras causas de , , e (por exemplo, variáveis ​​não modeladas, entradas aleatórias) são deixadas implícitas.EΔOtQt-1Et-1ΔEtOt-1OtEt-1Et

A parte desta resposta correspondente aos dois primeiros DAGs é cortesia da comunicação pessoal com Miguel Hernán.

Alexis
fonte
1

EDITAR:

Se você está preocupado apenas em representar relacionamentos não paramétricos entre suas variáveis, acho que 1) seria o mais apropriado. Embora possa haver uma forma funcional mais específica relacionando as duas variáveis ​​ao resultado, em um DAG, não é necessário representar essa forma. Por outro lado, se você quiser usar um diagrama de caminhos representando um modelo de equação estrutural linear como o que você escreveu, faria sentido incluir a pontuação da diferença no diagrama; Dessa forma, o modelo específico que você escreveu e o diagrama seriam igualmente específicos. Um DAG é mais vago (mas também mais flexível), pois não requer (ou permite) a forma específica da função.

Isso pode se resumir ao objetivo de desenhar seu DAG. Se seu objetivo é representar com o máximo de precisão possível os relacionamentos entre suas variáveis, faria sentido incluir o termo de diferença como sua própria variável, pois ele possui sua própria força causal. Um gráfico sem ele também seria válido. Em teoria, você poderia fazer as mesmas declarações de independência condicional sobre o resultado e os preditores com um DAG mais detalhado do que com um DAG menos detalhado.


Minha intuição está mais próxima de 3). Se é verdade que e não afetam diretamente exceto pela diferença, 3) está correto, e eu adicionaria arestas de e a e de a para completar. Nenhum outro nó apontaria para a variável de diferença, mas as variáveis ​​que preveem a diferença apontariam para e / ou . Graficamente, o que estou descrevendo é:E 2 O E 1 E 2E1E2OE1E2ΔE2E1E2E1E2

E1
 |---->  E2-E1 ---> O
 V       ^
E2-------|

com possíveis setas adicionais de e a se eles afetarem além do efeito causado pela diferença.E1E2OO

Noé
fonte
"Se é verdade que E1 e E2 não afetam diretamente O, exceto pela diferença", você parece estar ignorando o modelo que especifiquei.
Alexis
Segunda preocupação. A variável de interação é puramente uma função de e ; no entanto, essa variável não seria representada porque você desenhou o DAG em sua resposta , portanto é não está absolutamente claro para mim que, mesmo se eu estivesse interessado no modelo seu DAG estaria correto. E1×E2E1E2ΔO=β0 0+ΔE2+ε
Alexis #
Essas são boas preocupações. Eu estava ignorando o modelo que você especificou e focando na sua pergunta. Você deseja especificar um diagrama de caminho representando um modelo de equação estrutural linear ou um DAG não paramétrico? No primeiro caso, convém incluir o termo de diferença como sua própria variável. Caso contrário, como você mencionou, seria apropriado não fazê-lo (exatamente como seria com uma interação). Vou revisar minha resposta.
Noah
A questão não tem nada a ver com SEMs. Você pode perceber porque o SEM não aparece na pergunta, mesmo como uma tag. :) Por outro lado, minha pergunta é sobre DAGs. :) Além disso: em relação ao meu segundo comentário "nada claro" não significa que você não esteja correto ... apenas significa que preciso persuadir sobre os formalismos do DAG.
Alexis
1
Minha resposta provavelmente não é muito persuasiva, mas espero que outra pessoa possa fazer um trabalho melhor. O modelo que você escreveu é um SEM linear, portanto, embora você não tenha perguntado especificamente sobre isso, se você está tentando relacionar algum tipo de diagrama de caminho com os termos de um modelo, está se aventurando no território do diagrama de caminho SEM.
Noah