Eu tenho uma variável contínua, amostrada durante um período de um ano em intervalos irregulares. Alguns dias têm mais de uma observação por hora, enquanto outros não têm nada por dias. Isso torna particularmente difícil detectar padrões nas séries temporais, porque alguns meses (por exemplo, outubro) são altamente amostrados, enquanto outros não.
Minha pergunta é qual seria a melhor abordagem para modelar essa série temporal?
- Acredito que a maioria das técnicas de análise de séries temporais (como o ARMA) precisa de uma frequência fixa. Eu poderia agregar os dados, para ter uma amostra constante ou escolher um subconjunto dos dados que é muito detalhado. Com as duas opções, faltavam algumas informações do conjunto de dados original, que poderiam revelar padrões distintos.
- Em vez de decompor a série em ciclos, eu poderia alimentar o modelo com todo o conjunto de dados e esperar que ele pegasse os padrões. Por exemplo, eu transformei a hora, dia da semana e mês em variáveis categóricas e tentei uma regressão múltipla com bons resultados (R2 = 0,71)
Eu tenho a ideia de que técnicas de aprendizado de máquina como a RNA também podem escolher esses padrões em séries temporais desiguais, mas eu queria saber se alguém já tentou isso e poderia me fornecer alguns conselhos sobre a melhor maneira de representar padrões de tempo em uma rede Neural.
fonte