Como interpreto minha regressão com as primeiras variáveis diferenciadas?

Eu tenho duas séries temporais:

Um proxy para o prêmio de risco de mercado (ERP; linha vermelha)
A taxa livre de risco, representada por um título do governo (linha azul)

Proxy de prêmio de risco e taxa sem risco ao longo do tempo

Quero testar se a taxa livre de risco pode explicar o ERP. Por este meio, segui basicamente o conselho de Tsay (2010, 3ª edição, p. 96): Financial Time Series:

Ajuste o modelo de regressão linear e verifique as correlações seriais dos resíduos.
Se a série residual for não estacionária de raiz unitária, considere a primeira diferença das variáveis dependentes e explicativas.

Fazendo o primeiro passo, obtenho os seguintes resultados:

Coefficients:
               Estimate Std. Error t value Pr(>|t|)    
(Intercept)     6.77019    0.25103   26.97   <2e-16 ***
Risk_Free_Rate -0.65320    0.04123  -15.84   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Como esperado da figura, a relação é negativa e significativa. No entanto, os resíduos são serialmente correlacionados:

Função ACF dos resíduos da regressão da taxa livre de risco no ERP

Portanto, primeiro eu diferencio a variável dependente e a explicativa. Aqui está o que eu recebo:

Coefficients:
                Estimate Std. Error t value Pr(>|t|)    
(Intercept)    -0.002077   0.016497  -0.126      0.9    
Risk_Free_Rate -0.958267   0.053731 -17.834   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

E o ACF dos resíduos se parece com:

Função ACF dos resíduos da regressão da taxa livre de risco no ERP (diferenciado)

Esse resultado parece ótimo: primeiro, os resíduos agora não estão correlacionados. Segundo, a relação parece ser mais negativa agora.

Aqui estão minhas perguntas (você provavelmente já se perguntou ;-) A primeira regressão, eu teria interpretado como (problemas econométricos à parte) "se a taxa livre de risco subir um ponto percentual, o ERP cairá 0,65 ponto percentual". Na verdade, depois de refletir sobre isso por um tempo, eu interpretaria a segunda regressão da mesma forma (agora resultando em uma queda de 0,96 pontos percentuais). Esta interpretação está correta? Parece estranho eu transformar minhas variáveis, mas não preciso mudar minha interpretação. Se isso, no entanto, estiver correto, por que os resultados mudam? Isso é apenas o resultado de problemas econométricos? Nesse caso, alguém tem uma idéia de por que minha segunda regressão parece ser ainda "melhor"? Normalmente, eu sempre leio que você pode ter correlações espúrias que desaparecem depois que você faz isso corretamente. Aqui,

regression time-series Christoph_J
fonte

Respostas:

Suponha que tenhamos o modelo Você diz que esses coeficientes são mais fáceis de interpretar. Vamos subtrair do lado esquerdo e , que é igual a , do lado direito. Temos O intercepto na equação da diferença é a tendência do tempo. E o coeficiente em tem a mesma interpretação que no modelo original.

y_{t} = β_{0} + β_{1} x_{t} + β_{2} t + ϵ_{t} .

$\begin{equation*} y_t = \beta_0 + \beta_1 x_t + \beta_2 t + \epsilon_t. \end{equation*}$

y_{t - 1}

$y_{t-1}$

β_{0} + β_{1} x_{t - 1} + β_{2} (t - 1) + ϵ_{t - 1}

$\beta_0 + \beta_1 x_{t-1} + \beta_2 ({t-1}) + \epsilon_{t-1}$

y_{t - 1}

$y_{t-1}$

Δ y_{t} = β_{1} Δ x_{t} + β_{2} + Δ ϵ_{t} .

$\begin{equation*} \Delta y_t = \beta_1 \Delta x_t + \beta_2 + \Delta \epsilon_t. \end{equation*}$

Δ x

$\Delta x$

β_{1}

$\beta_1$

Se os erros não forem estacionários, de tal forma que modo que seja ruído branco, o erro diferenciado é ruído branco.

ϵ_{t} = \sum_{s = 0}^{t - 1} ν_{s},

$\begin{equation*} \epsilon_t = \sum_{s=0}^{t-1}{\nu_s}, \end{equation*}$

ν_{s}

$\nu_s$

Se os erros tiverem uma distribuição estacionária de AR (p), digamos, o termo de erro diferenciado teria uma distribuição mais complicada e, principalmente, manteria a correlação serial. Ou se o original já tiver ruído branco (um AR (1) com um coeficiente de correlação de 0, se desejar), a diferenciação induz correlação serial entre os erros. $\epsilon$

Por esses motivos, é importante diferenciar apenas os processos não estacionários devido às raízes unitárias e os que prejudicam os chamados estacionários de tendência.

(Uma raiz de unidade faz com que a variação de uma série mude e ela realmente explode ao longo do tempo; no entanto, o valor esperado dessa série é constante. Um processo estacionário de tendência tem propriedades opostas.)

Charlie
fonte

Ótima resposta, obrigado pela explicação. Isso ajuda muito.

Christoph_J

+1 A última frase é ouro, e eu gostaria de ter visto isso tão claramente quando encontrei a idéia de diferenciar.

Wayne

Charlie, você se importaria de adicionar alguns esclarecimentos sobre algumas coisas? Primeiro você diz que "se o é ruído branco, então também é a diferença". O que você quer dizer com isso? Se eu considerar a diferença de um processo de ruído branco, o resultado é bastante fortemente correlacionado! Além disso, o que você quer dizer com "prejudicar" uma série temporal estacionária? Isso me parece contraditório no sentido de que uma série temporal estacionária, por definição, não tem tendência. Talvez no último caso você esteja se referindo apenas à estrutura de ruído e não à série em si (?). Felicidades.

ϵ

$\epsilon$

cardeal

Ótimos pontos, @ cardinal. Edições foram feitas. Espero que eles esclareçam as coisas.

Charlie

@Christoph_J, você tem que hoje está correlacionado com ontem; seu ACF mostra isso. O hoje provavelmente está correlacionado com ontem. O ontem está correlacionado com o ontem. Assim, o preditor incluído está correlacionado com uma variável omitida e você tem um problema de viés de variáveis omitidas. A diferença quebra essas correlações e evita o problema das variáveis omitidas.

y

$y$

y

$y$

x

$x$

x

$x$

x

$x$

y

$y$

x

$x$

y_{t - 1}

$y_{t-1}$

Charlie

A primeira diferenciação remove tendências lineares que parecem persistir nos seus resíduos originais. Parece que a primeira diferenciação removeu a tendência nos resíduos e você fica com resíduos basicamente não correlacionados. Penso que talvez a tendência nos resíduos oculte parte da relação negativa entre ERP e taxa livre de risco e essa seria a razão pela qual o modelo mostra uma relação mais forte após a diferenciação.

Michael R. Chernick
fonte

Como interpreto minha regressão com as primeiras variáveis ​​diferenciadas?

Respostas:

Como interpreto minha regressão com as primeiras variáveis diferenciadas?