O que fazer com explicações em séries temporais?

11

Tendo trabalhado principalmente com dados transversais até agora e navegando muito recentemente, explorando uma série de publicações introdutórias sobre séries temporais, imagino qual o papel das variáveis ​​explicativas na análise de séries temporais.

Eu gostaria de explicar uma tendência em vez de diminuir a tendência. A maior parte do que li como introdução pressupõe que a série é decorrente de algum processo estocástico. Eu li sobre processos AR (p) e MA, bem como modelagem ARIMA. Querendo lidar com mais informações do que apenas processos autoregressivos, encontrei o VAR / VECM e executei alguns exemplos, mas ainda me pergunto se há algum caso relacionado mais próximo ao que os explicativos fazem nas seções transversais.

A motivação por trás disso é que a decomposição de minhas séries mostra que a tendência é a principal contribuidora, enquanto o efeito restante e sazonal dificilmente desempenha um papel. Eu gostaria de explicar essa tendência.

Posso / devo regredir minha série em várias séries diferentes? Intuitivamente, eu usaria gls por causa da correlação serial (não tenho tanta certeza sobre a estrutura cor). Ouvi falar de regressão espúria e entendi que isso é uma armadilha, mas estou procurando uma maneira de explicar uma tendência.

Isso é completamente errado ou incomum? Ou acabei de perder o capítulo certo até agora?

hans0l0
fonte

Respostas:

15

Com base nos comentários que você ofereceu às respostas, você precisa estar ciente das causas espúrias . Qualquer variável com uma tendência temporal será correlacionada com outra variável que também tenha uma tendência temporal. Por exemplo, meu peso desde o nascimento até os 27 anos será altamente correlacionado com o seu peso, desde o nascimento até os 27 anos. Obviamente, meu peso não é causado pelo seu peso. Se fosse, eu pediria que você fosse à academia com mais frequência, por favor.

xtyt

xt=α0+α1t+ϵt andyt=β0+β1t+ηt.

yt=γ0+γ1xt+νt
xtγ1

Ao executar a análise de séries temporais, você precisa ter certeza de que suas variáveis ​​estão estacionárias ou obterá esses resultados de causalidade espúrios. Uma exceção seria a série integrada, mas eu os remeteria aos textos de séries temporais para saber mais sobre isso.

Charlie
fonte
5
+1 por exemplo de regressão espúria. Vai empregá-lo nas palestras :)
mpiktas
11
Ei, você vai à academia para perder peso? :)
hans0l0
6

A mesma intuição que na regressão de seção transversal pode ser usada na regressão de séries temporais. É perfeitamente válido tentar explicar a tendência usando outras variáveis. A principal diferença é que é assumido implicitamente que os regressores são variáveis ​​aleatórias. Então, no modelo de regressão:

Yt=β0+Xt1β1+...+Xtkβk+εt

E(εt|Xt1,...,Xtk)=0Eεt=0E(εt2|Xt1,...,Xtk)=σ2Eεt2=σ2

A parte prática da regressão permanece a mesma, todas as estatísticas e métodos usuais se aplicam.

Xtk

A principal advertência da regressão de séries temporais é que ela pode falhar massivamente quando os regressores não estão estacionários. Os métodos usuais de regressão podem mostrar que a tendência é explicada, quando na verdade não é. Portanto, se você deseja explicar a tendência, deve verificar a não estacionariedade antes de continuar. Caso contrário, você pode chegar a conclusões falsas.

mpiktas
fonte
11
Obrigado pela sua paciência. Ainda assim, o PIB poderia ser um possível explicativo para minha variável. Provavelmente é melhor usar taxas de crescimento, porque, caso contrário, apenas representa uma tendência temporal aqui. A razão pela qual quero usar uma regressão é porque estou interessado em extrair o que realmente NÃO é explicado por variáveis ​​de tendência de tempo como o PIB.
precisa saber é o seguinte
11
@ ran2, é sempre melhor usar o crescimento do PIB em vez de seu valor real. Observe que a análise de regressão também pode dizer quais variáveis não explicam a tendência; portanto, você pode acabar com o resultado de que não há variáveis ​​que possam explicar sua tendência (ou as variáveis ​​em que você pensou não explicam a tendência).
Mvctas #
11
@raegtin, processos estacionários que não têm segundos momentos, por exemplo.
Mvctas # 12/11
11
A única coisa que gostaria de acrescentar é ter cuidado com o uso do mundo "explicar". Alguns revisores não irão gostar disso.
Jase
11
@Jase, bem, usei o termo em um sentido solicitado pelo OP, ou seja, encontre uma relação estatística significativa.
mpiktas 27/12/12
3

Quando você tem séries de apoio / causais / de ajuda / do lado direito / exógenas / preditores, a abordagem preferida é construir uma única equação, função de transferência de entradas múltiplas. É preciso examinar possíveis resíduos de modelo para entradas determinísticas não especificadas / omitidas, como por exemplo, Detecção de Intervenção ala Ruey Tsay 1988 Journal of Forecasting e entradas estocásticas não especificadas por meio de um componente ARIMA. Assim, você pode incluir explicitamente não apenas os causais sugeridos pelo usuário (e quaisquer atrasos necessários!), Mas dois tipos de estruturas omitidas (manequins e ARIMA).

Deve-se tomar cuidado para garantir que os parâmetros do modelo final não sejam alterados significativamente ao longo do tempo, caso contrário a segmentação de dados poderá estar em ordem e que não se pode provar que os resíduos do modelo final tenham variação heterogênea.

A tendência na série original pode ser devida a tendências na série de preditores ou devido à dinâmica autoregressiva da série de interesse ou potencialmente devido a uma série determinística omitida por um proxy constante por uma constante de estado estacionário ou mesmo uma ou mais tendências de horário local.

IrishStat
fonte
0

Como um ponto de vista menos técnico, muitas vezes não é muito útil apenas explicar a tendência; isto é, tratar o tempo como o preditor de interesse primário. A variação de uma série ao longo do tempo geralmente implica os efeitos subjacentes de outras variáveis, incluindo processos autorregressivos e / ou exógenos, o que é mais conceitualmente relevante para investigar. Daqui resulta que, se essas variáveis ​​também variarem ao longo do tempo, é necessário que o controle do efeito de tempo não caia no relacionamento artificialmente significativo, como o @mpiktas mostrou.

NonSleeper
fonte