Tenho uma série temporal diária bastante previsível com sazonalidade semanal. Sou capaz de apresentar previsões que parecem bastante precisas (confirmadas pela validação cruzada) quando não há feriados. No entanto, quando há feriados, tenho os seguintes problemas:
- Na minha previsão, recebo números diferentes de zero para os feriados, mesmo que todos os feriados históricos sejam 0. Esse não é o problema principal. A questão é ...
- Como o processamento que não ocorre nos feriados "transborda" para os dias seguintes aos feriados, uma variável dummy simples não a reduz, pois esses valores discrepantes parecem inovadores a curto prazo. Se não houvesse sazonalidade semanal, talvez eu pudesse apresentar uma estimativa para distribuir os dados não processados do feriado nos cinco ou mais dias seguintes ao feriado (conforme sugerido em Como criar variáveis que refletem o impacto de lead e lag dos feriados / efeitos de calendário em uma análise de séries temporais? ). No entanto, a distribuição do "transbordamento" depende do dia da semana em que o feriado ocorre, e se é feriado de Natal ou de Ação de Graças, onde os pedidos são feitos a uma taxa menor que o resto do ano.
Aqui estão alguns instantâneos da minha validação cruzada que mostram o resultado previsto (azul) versus o resultado real (vermelho) dos feriados que aparecem em diferentes dias da semana:
Também me preocupo que o impacto do Natal dependa do dia da semana em que ele cai, e só tenho seis anos de dados históricos.
Alguém tem alguma sugestão de como lidar com esses tipos de discrepâncias inovadoras no contexto da previsão? (Infelizmente não posso compartilhar nenhum dado)
time-series
forecasting
arima
outliers
Julia Maddalena
fonte
fonte
Respostas:
Não foi possível criar uma variável fictícia para feriado, uma para feriado + 1 e outra para feriado + 2 e apenas defini-las como 1 desde que caiam em um dia da semana?
Quanto ao Dia de Ação de Graças e ao Natal, a introdução de variáveis fictícias separadas para esses feriados parece ser a pior opção (já que você tem apenas seis anos de dados). Até certo ponto, essa pode ser sua única opção - as pessoas simplesmente se comportam de maneira diferente nesses feriados do que em, digamos, em quatro de julho (e se você estiver estudando, por exemplo, padrões de vendas no varejo, você definitivamente simplesmente terá que conviver com eles. sendo feriados "especiais" e com certeza gostaria de analisá-los separadamente). No entanto, talvez as idéias abaixo sejam úteis para você:
Eu espero que isso ajude.
fonte