Como um passatempo paralelo, tenho explorado séries temporais de previsão (em particular, usando R).
Para os meus dados, tenho o número de visitas por dia, para todos os dias, voltando quase quatro anos. Nestes dados, existem alguns padrões distintos:
- De segunda a sexta tem muitas visitas (a mais alta de segunda a terça), mas drasticamente menos a sábado.
- Certas épocas do ano caem (ou seja, muito menos visitas nos feriados nos EUA, o verão mostra menos crescimento)
- Crescimento significativo ano a ano
Seria bom poder prever um próximo ano com esses dados e também usá-los para ter um crescimento mensal ajustado sazonalmente. O principal que me deixa com uma visão mensal é:
- Certos meses terão mais seg / ter do que outros meses (e isso também não é consistente ao longo dos anos). Portanto, um mês que acontece com mais dias da semana precisa ser ajustado de acordo.
Explorar semanas também parece difícil, pois os sistemas de numeração das semanas mudam de 52 a 53, dependendo do ano, e parece ts
que não lidam com isso.
Estou pensando em fazer uma média para os dias da semana do mês, mas a unidade resultante é um pouco estranha (Crescimento nas visitas médias durante a semana) e isso estaria descartando dados válidos.
Eu sinto que esse tipo de dados seria comum em séries temporais (digamos, por exemplo, o uso de eletricidade no prédio de escritórios pode ser algo assim), alguém tem algum conselho sobre como modelá-lo, em particular no R?
Os dados com os quais estou trabalhando são bastante diretos, começam como:
[,1]
2008-10-05 17607
2008-10-06 36368
2008-10-07 40250
2008-10-08 39631
2008-10-09 40870
2008-10-10 35706
2008-10-11 18245
2008-10-12 23528
2008-10-13 48077
2008-10-14 48500
2008-10-15 49017
2008-10-16 50733
2008-10-17 46909
2008-10-18 22467
e continua assim até o presente, com uma tendência geral de crescimento, algumas quedas nas semanas de férias nos EUA e um crescimento geralmente lento durante o verão.
fonte
ts
(e atémsts
) não se encaixa em um período de amostragem de uma semana com um período "natural" de um ano (nem os calendários, na verdade, eu acho). Ou, eu só não entendo como fazer esse trabalho ...Respostas:
Eu modelo assim tipos de dados o tempo todo. Você precisa incorporar
A abordagem estatística é chamada de Transfer Function Modeling com Intervention DEtection. Se você deseja compartilhar seus dados de maneira privada via [email protected] ou preferencialmente via SE, ficaria feliz em mostrar as especificidades de um modelo final e aumentar sua capacidade de fazê-lo você mesmo ou, pelo menos, ajudá-lo e outros para entender o que precisa ser feito e o que pode ser feito. Em qualquer um dos casos, você fica mais esperto, sem gastar nenhum tesouro, seja com moeda ou tempo. Você pode ler algumas das minhas outras respostas às perguntas da série temporal para saber mais.
fonte