Como saber se uma série temporal é estacionária ou não estacionária?

30

Eu estou usando R, eu procurei no Google e descobriu que kpss.test(), PP.test()eadf.test() são usados para saber sobre estacionariedade de séries temporais.

Mas eu não sou um estatístico, que pode interpretar seus resultados

> PP.test(x)

     Phillips-Perron Unit Root Test
data:  x 
Dickey-Fuller = -30.649, Truncation lag parameter = 7, p-value = 0.01

> kpss.test(b$V1)

  KPSS Test for Level Stationarity
  data:  b$V1 
  KPSS Level = 0.0333, Truncation lag parameter = 3, p-value = 0.1

Warning message:
In kpss.test(b$V1) : p-value greater than printed p-value
> adf.test(x)

    Augmented Dickey-Fuller Test

data:  x 
Dickey-Fuller = -9.6825, Lag order = 9, p-value = 0.01
alternative hypothesis: stationary

Warning message:
In adf.test(x) : p-value smaller than printed p-value

Estou lidando com milhares de séries temporais. Por favor, diga como verificar quantitativamente a estacionariedade das séries temporais.

Sagar Nikam
fonte

Respostas:

22

Testar se uma série é estacionária versus não estacionária requer que você considere uma sequência de hipóteses alternativas. Um para cada suposição gaussiana listável. É preciso entender que as suposições gaussianas tratam do processo de erro e nada têm a ver com as séries observadas em avaliação. Como corretamente resumido pelo StasK, isso pode incluir violações da estacionariedade, como alteração média, alteração de variação, alterações nos parâmetros do modelo ao longo do tempo. Por exemplo, um conjunto de valores de tendência ascendente seria um exemplo prima facie de uma série que em Y não era constante, enquanto os resíduos de um modelo adequado podem ser descritos como tendo uma média constante. Assim, a série original é não estacionária na média, mas a série residual é estacionária na sua média. Se houver violações médias não mitigadas nas séries residuais, como Pulsos, Mudanças de Nível, Pulsos Sazonais e / ou Tendências de Hora Local, a série residual (não tratada) pode ser caracterizada como não estacionária na média, enquanto uma série de variáveis ​​indicadoras pode ser facilmente detectado e incorporado ao modelo para tornar os resíduos estacionários na média. Agora, se a variação da série original exibir variação não estacionária, é bastante razoável restringir um filtro / modelo para renderizar um processo de erro com variação constante. Da mesma forma, os resíduos de um modelo podem ter uma variação não constante, exigindo uma das três soluções possíveis - Pulsos sazonais e / ou tendências da hora local, a série residual (não tratada) pode ser caracterizada como não estacionária na média, enquanto uma série de variáveis ​​indicadoras pode ser facilmente detectada e incorporada ao modelo para tornar os resíduos estacionários na média . Agora, se a variação da série original exibir variação não estacionária, é bastante razoável restringir um filtro / modelo para renderizar um processo de erro com variação constante. Da mesma forma, os resíduos de um modelo podem ter uma variação não constante, exigindo uma das três soluções possíveis - Pulsos sazonais e / ou tendências de horário local, a série residual (não tratada) pode ser caracterizada como não estacionária na média, enquanto uma série de variáveis ​​indicadoras pode ser facilmente detectada e incorporada ao modelo para tornar os resíduos do modelo estacionários na média . Agora, se a variação da série original exibir variação não estacionária, é bastante razoável restringir um filtro / modelo para renderizar um processo de erro com variação constante. Da mesma forma, os resíduos de um modelo podem ter uma variação não constante, exigindo uma das três soluções possíveis - Agora, se a variação da série original exibir variação não estacionária, é bastante razoável restringir um filtro / modelo para renderizar um processo de erro com variação constante. Da mesma forma, os resíduos de um modelo podem ter uma variação não constante, exigindo uma das três soluções possíveis - Agora, se a variação da série original exibir variação não estacionária, é bastante razoável restringir um filtro / modelo para renderizar um processo de erro com variação constante. Da mesma forma, os resíduos de um modelo podem ter uma variação não constante, exigindo uma das três soluções possíveis -

  1. Mínimos Quadrados Ponderados (geralmente ignorados por alguns analistas)
  2. Uma transformação de poder para dissociar o valor esperado da variação dos erros identificáveis ​​por meio de um teste de Box-Cox e / ou
  3. Necessidade de um modelo GARCH para contabilizar uma estrutura ARIMA evidente nos resíduos quadrados. Continuando se os parâmetros mudam ao longo do tempo OU a forma do modelo muda ao longo do tempo, é preciso detectar essa característica e remediá-la com a segmentação de dados ou a utilização de uma abordagem TAR à la Tong.
IrishStat
fonte
34

yt=sint não é estacionário, pois sua média continua mudando, embora, na sua frente, esse seja um processo bastante simples e previsível.

yt=yt1+ϵt
yt2yt3com pequenos coeficientes). Este é um modelo simples de um mercado financeiro eficiente, onde nenhuma informação pode ser usada para prever as futuras mudanças nos preços. A maioria dos economistas pensa que suas séries temporais são provenientes dos modelos ARIMA; essas séries cronológicas têm períodos bem definidos em que as coisas acontecem (mês, trimestre ou ano); portanto, raramente pioram do que uma série cronológica integrada para elas. Portanto, esses testes não foram projetados para violações mais complexas da estacionariedade, como alteração média, alteração de variação, alteração nos coeficientes autoregressivos etc., embora os testes para esses efeitos também tenham sido obviamente desenvolvidos também.

Nas ciências naturais ou de engenharia, é mais provável que você encontre séries temporais com problemas mais complicados, como dependência de longo alcance, integração fracionária, ruído rosado etc. Com a falta de orientações claras da descrição do processo em relação às escalas de tempo típicas ( com que frequência o clima muda?), geralmente faz mais sentido analisar os dados no domínio da frequência (enquanto para os economistas, o domínio da frequência é bastante claro: existem ciclos sazonais anuais, além de ciclos comerciais mais longos de 3 a 5 anos ; poucas surpresas podem ocorrer de outra maneira).

p0.05/(3M)M30.05ppp.test(x)$p.value

StasK
fonte
4

As séries temporais são estacionárias se seu nível médio e variação permanecerem constantes ao longo do tempo. Você pode ler mais sobre este tópico (com especificação de testes relevantes em R), em nosso post. Http://www.statosphere.com.au/check-time-series-stationary-r/

STAToSphere
fonte
11
Comentário tardio, mas o que você quer dizer com média e variação permanecem constantes ao longo do tempo? Para um determinado conjunto de dados, a média e a variação são o que são, certo? Ou você quer dizer que a média / var de todos os subconjuntos dos dados deve ser igual?
Erik Vesterlund
2
Dei uma olhada na página vinculada. É afirmado que "o teste de Ljung-Box examina se há evidências significativas de correlações diferentes de zero nos lags 1-20. Valores p pequenos (ou seja, menores que 0,05) sugerem que a série é estacionária". A conclusão está completamente errada. O nulo é que as observações são iid. Rejeitar o nulo com base em um pequeno valor p indica apenas que há pelo menos um atraso significativo. A conclusão no site significaria que a estacionariedade requer autocorrelação significativa por pelo menos um atraso. E isso não é verdade.
random_guy