Previsão de séries temporais usando ARIMA vs LSTM

9

O problema com o qual estou lidando é prever valores de séries temporais. Estou analisando uma série temporal por vez e, com base em, por exemplo, 15% dos dados de entrada, gostaria de prever seus valores futuros. Até agora me deparei com dois modelos:

  • LSTM (memória de longo prazo; uma classe de redes neurais recorrentes)
  • ARIMA

Eu tentei os dois e li alguns artigos sobre eles. Agora, estou tentando entender melhor como comparar os dois. O que eu encontrei até agora:

  1. O LSTM funciona melhor se estivermos lidando com uma quantidade enorme de dados e dados de treinamento suficientes estiverem disponíveis, enquanto o ARIMA é melhor para conjuntos de dados menores (isso está correto?)
  2. O ARIMA requer uma série de parâmetros (p,q,d)que devem ser calculados com base nos dados, enquanto o LSTM não exige a configuração desses parâmetros. No entanto, existem alguns hiperparâmetros que precisamos ajustar para o LSTM.

Além das propriedades acima mencionadas, não encontrei outros pontos ou fatos que pudessem me ajudar a selecionar o melhor modelo. Ficaria muito grato se alguém pudesse me ajudar a encontrar artigos, papéis ou outras coisas (até agora não tive sorte, apenas algumas opiniões gerais aqui e ali e nada baseado em experimentos).

Devo mencionar que, originalmente, estou lidando com dados de streaming, no entanto, por enquanto, estou usando conjuntos de dados NAB, que incluem 50 conjuntos de dados com o tamanho máximo de 20k pontos de dados.

ahajib
fonte
11
Por que você simplesmente não experimenta os dois modelos em parte de seus dados, vê qual deles é melhor na previsão e o escolhe. Ou use os dois modelos e combine suas previsões. As combinações de previsão geralmente superam as previsões individuais.
Richard Hardy
@RichardHardy Eu já fiz isso e estou ciente do desempenho deles nos meus conjuntos de dados. Estou tentando entender melhor os dois, especialmente as desvantagens deles, para ver qual deles pode ser o melhor candidato para lidar com as próximas amostras de dados.
ahajib
Leia o centro de ajuda - em particular o terceiro parágrafo, que diz " Observe, no entanto, que a postagem cruzada não é incentivada nos sites do SE. Escolha um local melhor para postar sua pergunta. Mais tarde, se for mais adequado para outro site, ele pode ser migrado. "
Glen_b -Reinstate Monica

Respostas:

2

Uma comparação de modelos de redes neurais artificiais e de séries temporais para previsão de preços de commodities compara o desempenho da ANN e ARIMA na previsão de séries temporais financeiras. Eu acho que é um bom ponto de partida para sua revisão de literatura.

Em muitos casos, as redes neurais tendem a superar os modelos baseados em RA. No entanto, acho que uma grande desvantagem (que não é discutida tanto na literatura acadêmica) com métodos mais avançados de aprendizado de máquina é que eles usam caixas pretas. Esse é um grande problema se você tiver que explicar como o modelo funciona para alguém que não conhece muito desses modelos (por exemplo, em uma corporação). Mas se você estiver fazendo essa análise apenas como um trabalho escolar, não acho que isso seja um problema.

Mas, como o comentarista anterior disse, geralmente, a melhor maneira é formar um estimador de conjuntos no qual você combina dois ou mais modelos.

Juha
fonte
7
O juiz que você citou lida com redes neurais simples e antecipadas e é velho demais para ser útil (a década de 1990 é um século atrás). A pergunta do OP pergunta sobre a rede neural recorrente com a arquitetura LSTM e este artigo não cobre isso.
horaceT
11
Como o @horaceT mencionou, este artigo está um pouco desatualizado e se você puder sugerir um artigo mais recente que inclua informações sobre LSTMs, seria incrível. Graças
ahajib