Eu tenho uma grande coleção de séries temporais - medições feitas a cada 15 minutos (96 medições em um dia) ao longo de 1 ano em vários locais diferentes.
Dividi cada série temporal em 365 séries temporais menores e separadas, uma para cada dia do ano. Observando essas séries temporais, certamente existem muitas formas distintas para um único dia. Alguns parecem sinusoidais, outros são constantes, outros parecem um processo estocástico aleatório, alguns parecem parabólicos e outros parecem U's.
O que eu gostaria de fazer é usar um algoritmo que possa encontrar essas formas comuns. Pensei em cluster e em usar os centróides do cluster para definir formas comuns, mas queria verificar com a comunidade se isso está correto. Até agora, vi o Dynamic Time Warp como uma métrica, mas parece que essa métrica requer muita computação. Eu também encontrei
http://mox.polimi.it/it/progetti/pubblicazioni/quaderni/13-2008.pdf de SE.
Também vi É possível fazer cluster de séries temporais com base no formato da curva? mas essa pergunta foi de 2010 e pode estar desatualizada.
Outra idéia que tive foi fazer composições automáticas de matrizes formatadas como:
Matriz é uma matriz de todas as séries temporais observadas no dia . Cada linha da matriz é uma série temporal de comprimento 96. Então, eu faria 365 composições de autogestão e usaria os autovetores como formas comuns. Isso soa razoável?
Obrigado!
fonte