Crescimento mensal ajustado sazonalmente com sazonalidade semanal subjacente

9

Como um passatempo paralelo, tenho explorado séries temporais de previsão (em particular, usando R).

Para os meus dados, tenho o número de visitas por dia, para todos os dias, voltando quase quatro anos. Nestes dados, existem alguns padrões distintos:

  1. De segunda a sexta tem muitas visitas (a mais alta de segunda a terça), mas drasticamente menos a sábado.
  2. Certas épocas do ano caem (ou seja, muito menos visitas nos feriados nos EUA, o verão mostra menos crescimento)
  3. Crescimento significativo ano a ano

Seria bom poder prever um próximo ano com esses dados e também usá-los para ter um crescimento mensal ajustado sazonalmente. O principal que me deixa com uma visão mensal é:

  • Certos meses terão mais seg / ter do que outros meses (e isso também não é consistente ao longo dos anos). Portanto, um mês que acontece com mais dias da semana precisa ser ajustado de acordo.

Explorar semanas também parece difícil, pois os sistemas de numeração das semanas mudam de 52 a 53, dependendo do ano, e parece tsque não lidam com isso.

Estou pensando em fazer uma média para os dias da semana do mês, mas a unidade resultante é um pouco estranha (Crescimento nas visitas médias durante a semana) e isso estaria descartando dados válidos.

Eu sinto que esse tipo de dados seria comum em séries temporais (digamos, por exemplo, o uso de eletricidade no prédio de escritórios pode ser algo assim), alguém tem algum conselho sobre como modelá-lo, em particular no R?

Os dados com os quais estou trabalhando são bastante diretos, começam como:

            [,1]
2008-10-05 17607
2008-10-06 36368
2008-10-07 40250
2008-10-08 39631
2008-10-09 40870
2008-10-10 35706
2008-10-11 18245
2008-10-12 23528
2008-10-13 48077
2008-10-14 48500
2008-10-15 49017
2008-10-16 50733
2008-10-17 46909
2008-10-18 22467

e continua assim até o presente, com uma tendência geral de crescimento, algumas quedas nas semanas de férias nos EUA e um crescimento geralmente lento durante o verão.

Kyle Brandt
fonte
Outro aspecto interessante para os dados é que há eventos repentinos que interrompem a tendência geral de crescimento por um período de dois meses. Agora, porém, onde estou na fase de tentar definir adequadamente a sazonalidade, estou ignorando esse aspecto.
Kyle Brandt
Além disso, corrija-me se não estiver usando a "sazonalidade" corretamente. Atualmente, estou pensando nisso um padrão na unidade de tempo que eu digo. Então, "Sazonalidade Semanal" para mim significa "Um padrão que se repete a cada semana".
Kyle Brandt
Hmm, soa familiar (-;
Veja as respostas para stats.stackexchange.com/questions/14742/… . Pode ser um ponto de partida.
Peter Ellis
Talvez no centro disso esteja a combinação de semana + ano? Parece ts(e até msts) não se encaixa em um período de amostragem de uma semana com um período "natural" de um ano (nem os calendários, na verdade, eu acho). Ou, eu só não entendo como fazer esse trabalho ...
Kyle Brandt

Respostas:

5

Eu modelo assim tipos de dados o tempo todo. Você precisa incorporar

  • dia da semana
  • efeitos de férias (chumbo, efeitos contemporâneos e lag)
  • dias especiais do mês
  • talvez sexta-feira antes de um feriado ou uma segunda-feira depois de um feriado
  • efeitos semanais
  • efeitos mensais
  • Estrutura ARIMA para tornar os erros ruído branco;
  • et.al. .

A abordagem estatística é chamada de Transfer Function Modeling com Intervention DEtection. Se você deseja compartilhar seus dados de maneira privada via [email protected] ou preferencialmente via SE, ficaria feliz em mostrar as especificidades de um modelo final e aumentar sua capacidade de fazê-lo você mesmo ou, pelo menos, ajudá-lo e outros para entender o que precisa ser feito e o que pode ser feito. Em qualquer um dos casos, você fica mais esperto, sem gastar nenhum tesouro, seja com moeda ou tempo. Você pode ler algumas das minhas outras respostas às perguntas da série temporal para saber mais.

IrishStat
fonte