Estou usando uma série temporal diária de dados de vendas que contém cerca de 2 anos de pontos de dados diários. Com base em alguns dos tutoriais / exemplos on-line, tentei identificar a sazonalidade nos dados. Parece haver periodicidade / sazonalidade semanal, mensal e provavelmente anual.
Por exemplo, existem dias de pagamento, particularmente no primeiro efeito do dia de pagamento do mês, que dura alguns dias durante a semana. Existem também alguns efeitos específicos de férias, claramente identificáveis, observando as observações.
Equipado com algumas dessas observações, tentei o seguinte:
ARIMA (com
Arima
eauto.arima
do pacote de previsão R), usando regressor (e outros valores padrão necessários na função). O regressor que criei é basicamente uma matriz de valores 0/1:- Variáveis de 11 meses (n-1)
- 12 variáveis de férias
- Não foi possível descobrir a parte do dia do pagamento ... já que é um efeito pouco mais complicado do que eu pensava. O efeito do dia de pagamento funciona de maneira diferente, dependendo do dia da semana do 1º do mês.
Eu usei 7 (ou seja, frequência semanal) para modelar as séries temporais. Eu tentei o teste - prevendo 7 dias por vez. Os resultados são razoáveis: a precisão média para uma previsão de 11 semanas chega ao RMSE médio semanal de 5%.
Modelo TBATS (do pacote R-forecast) - usando sazonalidade múltipla (7, 30.4375, 365.25) e obviamente nenhum regressor. A precisão é surpreendentemente melhor que o modelo ARIMA na RMSE média semanal de 3,5%.
Nesse caso, o modelo sem erros ARMA apresenta um desempenho um pouco melhor. Agora, se eu aplicar os coeficientes apenas aos efeitos de férias do modelo ARIMA descrito em # 1, aos resultados do modelo TBATS, o RMSE médio semanal aumenta para 2,95%
Agora, sem ter muita experiência ou conhecimento sobre as teorias subjacentes desses modelos, estou em um dilema se essa abordagem TBATS é válida. Embora esteja melhorando significativamente o RMSE no teste de 11 semanas, estou me perguntando se ele pode sustentar essa precisão no futuro. Ou mesmo se a aplicação de efeitos Holiday do ARIMA ao resultado TBATS for justificável. Qualquer opinião de qualquer / todos os colaboradores será muito apreciada.
Nota: Faça "Salvar link como" para baixar o arquivo.
Respostas:
Você deve avaliar modelos e previsões de diferentes origens em diferentes horizontes, e não um número único, a fim de avaliar uma abordagem.
Presumo que seus dados sejam dos EUA. Prefiro mais de três anos de dados diários, pois você pode passar dois feriados em um fim de semana e não ler os dias da semana. Parece que seu impacto no Dia de Ação de Graças é um dia de folga em 2012 ou houve algum erro de gravação e causou a perda do modelo do efeito do dia de Ação de Graças.
Janeiro é geralmente baixo no conjunto de dados se você olhar como uma porcentagem do ano. Fins de semana são altos. Os manequins refletem esse comportamento .... MONTH_EFF01, FIXED_EFF_N10507, FIXED_EFF_N10607
Descobri que o uso de um componente AR com dados diários pressupõe que, nas últimas duas semanas do dia da semana, o padrão é como o padrão é, em geral, o que é uma grande suposição. Começamos com 11 manequins mensais e 6 manequins diários. Alguns abandonaram o modelo. B ** 1 significa que há um impacto de atraso no dia seguinte ao feriado. Houve 6 dias especiais do mês (os dias 2,3,5,21,29,30 ---- 21 podem ser espúrios?) E 3 tendências de tempo, 2 pulsos sazonais (onde um dia da semana começou a se desviar do típico, um 0 antes desses dados e um 1 a cada 7 dias depois) e 2 outliers (observe o dia de ação de graças!) Isso levou pouco menos de 7 minutos para ser executado. Faça o download de todos os resultados aqui www.autobox.com/se/dd/daily.zip
Inclui uma folha XLS rápida e suja para verificar se o modelo faz sentido. Obviamente, os% XLS são de fato ruins, pois são benchmarks brutos.
Tente estimar este modelo:
fonte