Tendo trabalhado principalmente com dados transversais até agora e navegando muito recentemente, explorando uma série de publicações introdutórias sobre séries temporais, imagino qual o papel das variáveis explicativas na análise de séries temporais.
Eu gostaria de explicar uma tendência em vez de diminuir a tendência. A maior parte do que li como introdução pressupõe que a série é decorrente de algum processo estocástico. Eu li sobre processos AR (p) e MA, bem como modelagem ARIMA. Querendo lidar com mais informações do que apenas processos autoregressivos, encontrei o VAR / VECM e executei alguns exemplos, mas ainda me pergunto se há algum caso relacionado mais próximo ao que os explicativos fazem nas seções transversais.
A motivação por trás disso é que a decomposição de minhas séries mostra que a tendência é a principal contribuidora, enquanto o efeito restante e sazonal dificilmente desempenha um papel. Eu gostaria de explicar essa tendência.
Posso / devo regredir minha série em várias séries diferentes? Intuitivamente, eu usaria gls por causa da correlação serial (não tenho tanta certeza sobre a estrutura cor). Ouvi falar de regressão espúria e entendi que isso é uma armadilha, mas estou procurando uma maneira de explicar uma tendência.
Isso é completamente errado ou incomum? Ou acabei de perder o capítulo certo até agora?
fonte
A mesma intuição que na regressão de seção transversal pode ser usada na regressão de séries temporais. É perfeitamente válido tentar explicar a tendência usando outras variáveis. A principal diferença é que é assumido implicitamente que os regressores são variáveis aleatórias. Então, no modelo de regressão:
A parte prática da regressão permanece a mesma, todas as estatísticas e métodos usuais se aplicam.
A principal advertência da regressão de séries temporais é que ela pode falhar massivamente quando os regressores não estão estacionários. Os métodos usuais de regressão podem mostrar que a tendência é explicada, quando na verdade não é. Portanto, se você deseja explicar a tendência, deve verificar a não estacionariedade antes de continuar. Caso contrário, você pode chegar a conclusões falsas.
fonte
Quando você tem séries de apoio / causais / de ajuda / do lado direito / exógenas / preditores, a abordagem preferida é construir uma única equação, função de transferência de entradas múltiplas. É preciso examinar possíveis resíduos de modelo para entradas determinísticas não especificadas / omitidas, como por exemplo, Detecção de Intervenção ala Ruey Tsay 1988 Journal of Forecasting e entradas estocásticas não especificadas por meio de um componente ARIMA. Assim, você pode incluir explicitamente não apenas os causais sugeridos pelo usuário (e quaisquer atrasos necessários!), Mas dois tipos de estruturas omitidas (manequins e ARIMA).
Deve-se tomar cuidado para garantir que os parâmetros do modelo final não sejam alterados significativamente ao longo do tempo, caso contrário a segmentação de dados poderá estar em ordem e que não se pode provar que os resíduos do modelo final tenham variação heterogênea.
A tendência na série original pode ser devida a tendências na série de preditores ou devido à dinâmica autoregressiva da série de interesse ou potencialmente devido a uma série determinística omitida por um proxy constante por uma constante de estado estacionário ou mesmo uma ou mais tendências de horário local.
fonte
Como um ponto de vista menos técnico, muitas vezes não é muito útil apenas explicar a tendência; isto é, tratar o tempo como o preditor de interesse primário. A variação de uma série ao longo do tempo geralmente implica os efeitos subjacentes de outras variáveis, incluindo processos autorregressivos e / ou exógenos, o que é mais conceitualmente relevante para investigar. Daqui resulta que, se essas variáveis também variarem ao longo do tempo, é necessário que o controle do efeito de tempo não caia no relacionamento artificialmente significativo, como o @mpiktas mostrou.
fonte