Séries temporais biológicas multivariadas: VAR e sazonalidade

15

Eu tenho um conjunto de dados de séries temporais multivariadas, incluindo variáveis ​​biológicas e ambientais em interação (além de possivelmente algumas variáveis ​​exógenas). Além da sazonalidade, não há uma clara tendência de longo prazo nos dados. Meu objetivo é ver quais variáveis ​​estão relacionadas entre si. A previsão não é realmente procurada.

Sendo novo na análise de séries temporais, li várias referências. Até onde eu entendi, o modelo Vector Autoregressive (VAR) seria apropriado, mas não me sinto confortável com a sazonalidade e com a maioria dos exemplos que encontrei no campo da economia (como na análise de séries temporais ...) sem sazonalidade.

O que devo fazer com meus dados sazonais? Eu considerei dessazonalizá-los - por exemplo, em R, usaria decomposee depois usaria os $trend + $randvalores para obter um sinal que parece bem estacionário (conforme julgado acf). Os resultados do modelo VAR estão me confundindo (um modelo de 1 lag é selecionado enquanto eu esperaria intuitivamente mais, e apenas os coeficientes de regressão automática - e não de regressão com outras variáveis ​​atrasadas - são significativos). Estou fazendo algo errado ou devo concluir que minhas variáveis ​​não são (linearmente) relacionadas / que meu modelo não é o bom (questão subsidiária: existe um equivalente não linear para VAR?).

[Como alternativa, li que provavelmente poderia usar variáveis ​​sazonais fictícias, embora não consiga descobrir exatamente como implementá-lo].

As sugestões passo a passo seriam muito apreciadas, pois os detalhes para usuários experientes podem ser realmente informativos para mim (e trechos de código R ou links para exemplos concretos são muito bem-vindos, é claro).

ztl
fonte
2
Depende muito de como você pensa sobre a sazonalidade. Minha leitura irregular da literatura indica que os economistas geralmente consideram a sazonalidade um incômodo desinteressante, enquanto os cientistas ambientais costumam se sentir muito mais positivos sobre isso. O método das variáveis ​​simuladas, usado na economia, depende, freqüentemente, de dados trimestrais ou mensais e os efeitos das férias (em todos os sentidos da palavra) às vezes são espetaculares; Com dados ambientais, às vezes você pode se dar bem com alguns termos de Fourier (sinusoidais) e não precisa recorrer a manequins.
Nick Cox
2
Obrigado, @Nick Cox. Termos de Fourier não parecem ser uma solução no meu caso particular, onde variáveis ​​mostram um padrão sazonal mais complicado do que sinais sinusoidais (a menos que eu use vários harmônicos, mas esse não é o objetivo aqui). E, apesar de a sazonalidade claramente não ser um termo inconveniente desinteressante no meu caso, eu estava procurando algo que me ajudasse a explicar a variabilidade extra nos dados além da sazonalidade (isto é, a tendência de longo prazo) em função de outras variáveis.
ZTL
4
Que tal um modelo ARMA multivariado? É semelhante ao VAR, mas se eu entendi direito, permite uma interação mais dinâmica entre variáveis. Outra pessoa pode confirmar / rejeitar minha suspeita.
Rbatt

Respostas:

1

Eu sei que essa pergunta é praticamente antiga, mas permaneceu sem resposta. Talvez a questão principal não seja como remover o ciclo sazonal nos dados, mas faz parte dele, então vou tentar: Para remover a sazonalidade de um conjunto de dados, existem vários métodos, desde médias agregadas mensais simples até ajuste de uma função sinusoidal (ou outro harmônico apropriado) com métodos de ajuste não lineares como Nelder-Mead.

A maneira mais fácil é calcular a média dos dados pertencentes a todos os janeiro, a todos os fevereiro, e assim por diante, ou seja, você cria um ciclo anual composto, que pode ser subtraído dos dados.

nukimov
fonte