Confusão com o teste Dickey Fuller aumentado

16

Estou trabalhando em conjunto de dados electricitydisponíveis no pacote R TSA. Meu objetivo é descobrir se um arimamodelo será apropriado para esses dados e, eventualmente, se ajustará a eles. Portanto, procedi da seguinte maneira:

1º: Plote a série temporal que resultou se o seguinte gráfico: ts plot1

2º: Eu queria fazer logon electricitypara estabilizar a variância e depois diferenciá-la conforme apropriado, mas, pouco antes disso, testei a estacionariedade no conjunto de dados original usando o teste adf(Augmented Dickey Fuller) e, surpreendentemente, resultou da seguinte maneira:

Código e Resultados:

adf.test(electricity)

             Augmented Dickey-Fuller Test
data:  electricity 
Dickey-Fuller = -9.6336, Lag order = 7, p-value = 0.01 
alternative hypothesis: stationary
Warning message: In adf.test(electricity) : p-value smaller than printed p-value

Bem, de acordo com a noção de série temporal de meu iniciante, suponho que isso significa que os dados são estacionários (pequeno valor p, rejeitam a hipótese nula de não estacionariedade). Mas, olhando para o gráfico ts, não acho que isso possa ser estacionário. Alguém tem uma explicação válida para isso?

Vara
fonte
5
O ADF apenas testa a raiz da unidade estacionária; isso pode ser tendência estacionária. Portanto, você deve usar o teste KPSS, consulte stats.stackexchange.com/questions/30569/… Em geral, há uma diferença entre os modelos DS (estacionário com diferença) e TS (estacionário com tendência). O KPSS é o melhor teste para distinguir entre esses modelos; consulte o link para mais detalhes.
Stat Tistician
3
Parece que a série tem sazonais e tendências. Integre no teste do ADF uma tendência determinística + manequins sazonais e execute o teste. Verifique também se há resíduos autocorrelacionados.
Pantera1 de

Respostas:

12

adf.testxt-xt-1

> adf.test(electricity, k=12)

Augmented Dickey-Fuller Test
data:  electricity
Dickey-Fuller = -1.9414, Lag order = 12, p-value = 0.602
alternative hypothesis: stationary
horaceT
fonte
2

Supondo que "adf.test" realmente venha do pacote "tseries" (direta ou indiretamente), o motivo seria que ele inclui automaticamente uma tendência temporal linear. No documento do tseries (versão 0.10-35): "A equação de regressão geral que incorpora uma tendência linear e constante é usada" [...] "Portanto, o resultado do teste indica de fato a estacionariedade da tendência (que apesar do nome não é estacionária).

Também concordo com Pantera que os efeitos sazonais podem distorcer o resultado. A série poderia, na realidade, ser um processo de tendência temporal + sazonais determinísticos + raiz estocástica da unidade, mas o teste ADF pode interpretar mal as flutuações sazonais como reversões estocásticas da tendência determinística, o que implicaria raízes menores que a unidade. (Por outro lado, considerando que você incluiu atrasos suficientes, isso deve aparecer como raízes de unidade (falsas) em frequências sazonais, não na frequência zero / longo prazo que o teste do ADF analisa. Em qualquer caso, dado o padrão sazonal, é melhor incluir os sazonais.)

Sven S.
fonte