Método (s) de última geração para encontrar zero partes médias de uma série temporal

9

Tenho séries temporais barulhentas que preciso segmentar nessas porções com média zero e nas porções sem média zero. Encontrar os limites com a maior precisão possível é importante (claramente onde o limite se encontra com precisão é um pouco subjetivo). Eu acho que uma variante de cusum poderia ser adaptada para fazer isso, mas como cusum é principalmente sobre encontrar mudanças únicas que deixam toda a estratégia de segmentação completamente sem endereço.

Tenho certeza de que várias pesquisas foram feitas sobre esse problema, mas não conseguimos encontrá-lo.

PS A quantidade de dados nessas séries temporais é bastante grande, ou seja, até centenas de milhões de amostras, e uma amostra individual pode ser um vetor com algumas centenas de componentes; portanto, um método que pode ser calculado razoavelmente rapidamente é um fator significativo .

PPS Não existe uma etiqueta de segmentação, daí a etiqueta de classificação.

John Robertson
fonte

Respostas:

1

Isso pode não ser o estado da arte, mas um método intuitivo seria suavizar os dados colocando pesos nas observações próximas a cada ponto no tempo. Portanto, se você deseja saber se a amostra R tem uma média zero no tempo T:

mu(R,T)=w1*Sample(R,T)+w2*Sample(R,T-1)+w3*Sample(R,T+1)....

Talvez pesos exponenciais possam ser uma boa escolha, dependendo da definição de onde está o limite.

Depois de cuidar de alguns detalhes técnicos, como a definição no início e no final de cada somple, agora você pode simplesmente testar se cada mu está perto o suficiente para zero para encontrar os pontos em que a média é zero.

Dennis Jaheruddin
fonte