Como fazer uma série temporal estacionária?

42

Além de tirar diferenças, quais são as outras técnicas para fazer uma série temporal não estacionária, estacionária?

Normalmente, refere-se a uma série como " integrada de ordem p " se puder ser estacionária através de um operador de atraso .(1L)PXt

Shane
fonte

Respostas:

18

A tendência é fundamental. Isso inclui regressar contra covariáveis ​​que não o tempo.

O ajuste sazonal é uma versão das diferenças, mas pode ser interpretado como uma técnica separada.

A transformação dos dados converte implicitamente um operador de diferença em outra coisa; por exemplo, diferenças dos logaritmos são na verdade proporções.

Algumas técnicas de suavização da EDA (como remover uma mediana móvel) podem ser interpretadas como maneiras não paramétricas de prejudicar. Eles foram usados ​​como tal por Tukey em seu livro na EDA. Tukey continuou diminuindo os resíduos e repetindo esse processo pelo tempo necessário (até atingir resíduos que pareciam estacionários e distribuídos simetricamente em torno de zero).

whuber
fonte
você pode explicar melhor como a tendência é feita? Como remover o impacto das covariáveis ​​por regressão? Se eu estiver correto, isso só será aplicável a séries temporais multivariadas.
Arpit Sisodia
1
@Arpit Você substitui os dados originais por seus resíduos nas regressões contra as covariáveis. Aplica-se a séries temporais univariadas e multivariadas. Isso é explicado e ilustrado em stats.stackexchange.com/a/113207/919 e stats.stackexchange.com/a/46508/919 .
whuber
@whuber Você não acha que regressar contra covariáveis ​​(que podem não ser estacionárias) nos expõe ao problema da regressão espúria?
Vishaal Sudarsan
10

Ainda acho que usar a alteração% de um período para o próximo é a melhor maneira de tornar estacionária uma variável não estacionária, como você sugere primeiro. Uma transformação como um log funciona razoavelmente bem (nivela a qualidade não estacionária; mas não a elimina totalmente).

A terceira maneira é dessazonalizar e remover a tendência dos dados simultaneamente em uma única regressão linear. Uma variável independente seria tendência (ou tempo): 1, 2, 3, ... até quanto tempo você tem. E a outra variável seria uma variável categórica com 11 categorias diferentes (para 11 dos 12 meses). Em seguida, usando o coeficiente resultante dessa regressão, você pode simultaneamente prejudicar e descalonizar os dados. Você verá todo o seu conjunto de dados essencialmente achatado. As diferenças remanescentes entre os períodos refletirão mudanças independentes da tendência de crescimento e da estação.

Sympa
fonte
você pode explicar a coisa do coeficiente um pouco mais elaborada para iniciantes? Eu acho que vale a pena tentar sua abordagem, porque, se houver diferenças no meu caso (taxas de crescimento), a tendência se achatará, mas a sazonalidade se tornará forte. Portanto, vale a pena tentar a abordagem simulatênica. Mas o que faço com os dois coeficientes? Em particular, eu quero dizer os manequins ...
hans0l0
ran2, eu sei que pode não estar tão claro, mas não posso explicar muito melhor do que já tenho. É mais um reflexo das minhas habilidades de comunicação. Em vez disso, sugiro a correção básica que funciona mais frequentemente do que não. Isso é simplesmente alterar sua variável de série temporal nominal em uma variação de% de um período para o próximo e assim por diante. O foco na% de mudança, em vez dos valores nominais, muda imediatamente uma variável não estacionária para uma variável estacionária, que você pode regredir prontamente.
Sympa
7

Logs e recíprocos e outras transformações de potência geralmente produzem resultados inesperados.

Quanto aos resíduos prejudiciais (ou seja, Tukey), isso pode ter alguma aplicação em alguns casos, mas pode ser perigoso. Por outro lado, a detecção de mudanças de nível e mudanças de tendência está sistematicamente disponível para pesquisadores que empregam métodos de detecção de intervenção. Como uma mudança de nível é a diferença de uma tendência temporal, assim como um pulso é a diferença de uma mudança de nível, os métodos empregados por Ruey Tsay são facilmente cobertos por esse problema.

Se uma série exibir mudanças de nível (isto é, mudança na interceptação), o remédio apropriado para tornar a série estacionária é "humilhar" a série. Box-Jenkins cometeu um erro crítico ao assumir que o remédio para a não estacionariedade era um operador diferenciado. Portanto, algumas vezes a diferenciação é apropriada e outras vezes o ajuste para o deslocamento médio "s" é apropriado. Em ambos os casos, a função de autocorrelação pode exibir não estacionariedade. Este é um sintoma do estado da série (ou seja, estacionário ou não estacionário). No caso de não estacionariedade evidente, as causas podem ser diferentes. Por exemplo, a série tem realmente uma média variável contínua ou a série teve uma mudança temporária na média.

A abordagem sugerida foi proposta pela Tsay em 1982 e foi adicionada a alguns softwares. Os pesquisadores devem consultar o artigo do Tsay no Journal of Forecasting intitulado "Outliers, mudanças de nível e alterações de variação nas séries temporais", Journal of Forecasting, vol. 7, I-20 (1988).

Como de costume, os livros didáticos demoram a incorporar a tecnologia de ponta, mas esse material pode ser referenciado no livro Wei (isto é, análise de séries temporais), Delurgio e Makradakis cobrem as intervenções incorporadas, mas não como detectar como o texto de Wei.

Tom Reilly
fonte
4

Diferença com outra série. ou seja, os preços do petróleo Brent não são estacionários, mas o petróleo doce brent leve e espalhado é. Uma proposição mais arriscada para a previsão é apostar na existência de um relacionamento de co-integração com outra série temporal.

user603
fonte
4

Você poderia ajustar um loess / spline através dos dados e usar os resíduos? Os resíduos seriam estacionários?

Parece cheio de questões a serem consideradas, e talvez não haja uma indicação tão clara de uma curva excessivamente flexível quanto a de diferenciação excessiva.

Wayne
fonte
+1 por declarar a solução óbvia e ainda pouco discutida. Todo método está repleto de problemas, mas a suavização não paramétrica é fundamental e é preciso haver uma boa exploração de como todos os outros métodos prejudiciais propostos se relacionam com esse. Teria o prazer de ouvir de fontes relevantes ...
zkurtz