Em um comentário a esta pergunta , o usuário @whuber citou a possibilidade de usar uma versão periódica de splines para ajustar dados periódicos. Gostaria de saber mais sobre esse método, em particular as equações que definem os splines e como implementá-los na prática (sou principalmente um R
usuário, mas posso me contentar com MATLAB ou Python, se necessário). Além disso, mas é um "bom ter", seria ótimo saber sobre possíveis vantagens / desvantagens em relação ao ajuste de polinômios trigonométricos, que é como eu geralmente lido com esse tipo de dados (a menos que a resposta não seja muito suave, nesse caso, mudo para o Processo Gaussiano com kernel periódico).
regression
time-series
seasonality
splines
DeltaIV
fonte
fonte
Respostas:
As splines são usadas na modelagem de regressão para modelar formas funcionais não lineares possivelmente complexas. Uma tendência suavizada de spline consiste em polinômios contínuos por partes cujo coeficiente principal muda em cada ponto de interrupção ou nó. O spline pode ser especificado em termos do grau polinomial da tendência, bem como dos pontos de interrupção. Uma representação spline de uma covariável estende um único vetor de valores observados para uma matriz cuja dimensão é o grau polinomial mais o número de nós.
Uma versão periódica de splines é apenas uma versão periódica de qualquer regressão: os dados são cortados em réplicas da duração do período. Assim, por exemplo, modelar uma tendência diurna em um experimento de sexta-feira em ratos exigiria o tempo de recodificação do experimento em incrementos de 24 horas; portanto, a 154ª hora seria o valor do módulo 24 de 10 (154 = 6 * 24 + 10). Se você ajustar uma regressão linear nos dados de corte, estimaria uma forma de onda dente de serra para a tendência. Se você ajustar uma função step em algum lugar do período, seria uma forma de onda quadrada que se encaixa na série. O spline é capaz de expressar uma wavelet muito mais sofisticada. Para o que vale a pena, no
splines
pacote, há uma funçãoperiodicSpline
que faz exatamente isso.Você verá que eles são bastante concordantes. Além disso, a convenção de nomenclatura permite a interpretação. Na saída de regressão, você vê:
Eu vou assumir que você conhece a periodicidade dos dados em mãos. Se os dados não apresentarem um componente de crescimento ou média móvel, você poderá transformar uma longa série temporal em réplicas de uma curta série com duração de 1 período. Agora você tem réplicas e pode usar a análise de dados para estimar a tendência recorrente.
Suponha que eu gere as seguintes séries temporais um tanto ruidosas e muito longas:
A saída resultante mostra um desempenho razoável.
fonte