Estou usando os modelos R (3.1.1) e ARIMA para previsão. Gostaria de saber qual deve ser o parâmetro "frequency", atribuído na ts()
função , se estiver usando dados de séries temporais que sejam:
- separados por minutos e estão espalhados por 180 dias (1440 minutos / dia)
- separados por segundos e estão espalhados por 180 dias (86.400 segundos / dia).
Se bem me lembro da definição, uma "frequência" em st em R é o número de observações por "estação".
Pergunta parte 1:
Qual é a "estação" no meu caso?
Se a estação é "dia", então a "frequência" para minutos = 1440 e 86.400 por segundos?
Pergunta parte 2:
A "frequência" também pode depender do que estou tentando alcançar / prever? por exemplo, no meu caso, eu gostaria de ter uma previsão de curto prazo. Um passo à frente de 10 minutos de cada vez. Seria possível considerar a estação como uma hora em vez de um dia? Nesse caso, frequência = 60 por minutos, frequência = 3600 por segundos?
Tentei, por exemplo, usar frequency = 60 para os dados de minutos e obtive melhores resultados em comparação com frequency = 1440 (usado no fourier
link abaixo por Hyndman)
http://robjhyndman.com/hyndsight/forecasting-weekly-data/
(A comparação foi feita usando o MAPE para medir a precisão da previsão)
Caso os resultados sejam arbitrários completos, e a frequência não pode ser alterada. Qual seria realmente a interpretação do uso de freq = 60 nos meus dados?
Também acho que vale a pena mencionar que meus dados contêm sazonalidade a cada hora e a cada duas horas (observando os dados brutos e a função Autocorrelação)
fonte