Trabalho há meses na previsão de carga de curto prazo e no uso de dados climáticos / climáticos para melhorar a precisão. Eu tenho formação em ciência da computação e, por esse motivo, estou tentando não cometer grandes erros e comparações injustas trabalhando com ferramentas de estatística como os modelos ARIMA. Gostaria de saber sua opinião sobre algumas coisas:
Estou usando os modelos (S) ARIMA e (S) ARIMAX para investigar o efeito dos dados climáticos na previsão. Você acha que seria necessário usar também os métodos de suavização exponencial?
Tendo uma série temporal de 300 amostras diárias, estou começando nas duas primeiras semanas e realizo uma previsão de 5 dias usando modelos criados com a função auto.arima R (pacote de previsão). Em seguida, adiciono outra amostra ao meu conjunto de dados e calibro novamente os modelos e realizo mais 5 dias de previsão e assim por diante até o final dos dados disponíveis. Você acha que essa maneira de operar está correta?
Obrigado por suas sugestões, embora o objetivo de nosso trabalho seja um artigo de periódico de engenharia, eu gostaria de fazer um trabalho o mais rigoroso possível do ponto de vista estatístico.
fonte
Respostas:
Eu acho que valeria a pena explorar modelos de suavização exponencial também. Os modelos de suavização exponencial são uma classe de modelos fundamentalmente diferente dos modelos ARIMA e podem gerar resultados diferentes em seus dados.
Isso soa como uma abordagem válida e é muito semelhante ao método de validação cruzada de séries temporais proposto por Rob Hyndman .
Agregaria o erro de validação cruzada de cada previsão (suavização exponencial, ARIMA, ARMAX) e usaria o erro geral para comparar os três métodos.
Você também pode considerar uma "pesquisa em grade" para parâmetros ARIMA, em vez de usar o auto.arima. Em uma pesquisa em grade, você exploraria cada parâmetro possível para um modelo de arima e, em seguida, selecionava os "melhores" usando a precisão da previsão.
fonte