Eu tenho alguns dados de frequência cumulativos. Uma linha parece ajustar muito bem os dados, mas há uma oscilação cíclica / periódica na linha. Gostaria de estimar quando a frequência cumulativa atingirá um determinado valor c . Quando planto os resíduos versus os valores ajustados, recebo um belo comportamento sinusoidal.c
Agora, para adicionar outra complicação, observe que nos gráficos de resíduos
existem dois ciclos com valores mais baixos que os outros, o que representa um efeito de final de semana que também deve ser levado em consideração.
Então, para onde eu vou daqui? Como posso combinar algum termo cosseno, seno ou cíclico em um modelo de regressão para aprox. estimar quando a frequência cumulativa será igual a ?
fonte
Vamos começar observando que os mínimos quadrados comuns adequados a esses dados são provavelmente inapropriados. Se, como de costume, se supõe que os dados individuais que estão sendo acumulados tenham componentes de erro aleatórios, o erro nos dados cumulativos ( não nas frequências cumulativas - algo diferente do que você possui) é a soma cumulativa de todos os termos de erro. Isso torna os dados cumulativos heterocedásticos (eles se tornam cada vez mais variáveis ao longo do tempo) e fortemente correlacionados positivamente. Como esses dados são tão regularmente comportados, e há muitos deles, há pouco problema com o ajuste você receberá, mas suas estimativas de erros, suas previsões (que é a questão da questão) e, especialmente, seus erros padrão de previsão podem estar muito distantes.
Um procedimento padrão para analisar esses dados começa com os valores originais. Faça as diferenças do dia-a-dia para remover o componente sinusoidal de frequência mais alta. Pegue as diferenças semanais para remover um possível ciclo semanal. Analise o que resta. A modelagem ARIMA é uma abordagem flexível e poderosa, mas comece simplesmente: faça um gráfico desses dados diferenciados para ver o que está acontecendo e depois prossiga a partir daí. Observe também que, com menos de duas semanas de dados, suas estimativas do ciclo semanal serão fracas e essa incerteza dominará a incerteza nas previsões.
fonte
Claramente, a oscilação dominante tem período de um dia. Parece que também existem componentes de frequência mais baixa relacionados ao dia da semana; portanto, adicione um componente com frequência uma semana (ou seja, um sétimo de dia) e seus primeiros harmônicos. Isso fornece um modelo do formulário:
- assumindo que é medido em dias. Aqui é o dado bruto , não sua soma cumulativa.t y
fonte
Por que não usar apenas um GA para encontrar a amplitude, período e fase de uma série senoidal (ou cosseno) sequencialmente e depois combinados. Otimize o seguinte: (n (n-1) / ((np-1) ^ 2 (np-2))) RSS
fonte