Estou trabalhando em conjunto de dados electricity
disponíveis no pacote R TSA
. Meu objetivo é descobrir se um arima
modelo será apropriado para esses dados e, eventualmente, se ajustará a eles. Portanto, procedi da seguinte maneira:
1º: Plote a série temporal que resultou se o seguinte gráfico:
2º: Eu queria fazer logon electricity
para estabilizar a variância e depois diferenciá-la conforme apropriado, mas, pouco antes disso, testei a estacionariedade no conjunto de dados original usando o teste adf
(Augmented Dickey Fuller) e, surpreendentemente, resultou da seguinte maneira:
Código e Resultados:
adf.test(electricity)
Augmented Dickey-Fuller Test
data: electricity
Dickey-Fuller = -9.6336, Lag order = 7, p-value = 0.01
alternative hypothesis: stationary
Warning message: In adf.test(electricity) : p-value smaller than printed p-value
Bem, de acordo com a noção de série temporal de meu iniciante, suponho que isso significa que os dados são estacionários (pequeno valor p, rejeitam a hipótese nula de não estacionariedade). Mas, olhando para o gráfico ts, não acho que isso possa ser estacionário. Alguém tem uma explicação válida para isso?
fonte
Respostas:
adf.test
fonte
Supondo que "adf.test" realmente venha do pacote "tseries" (direta ou indiretamente), o motivo seria que ele inclui automaticamente uma tendência temporal linear. No documento do tseries (versão 0.10-35): "A equação de regressão geral que incorpora uma tendência linear e constante é usada" [...] "Portanto, o resultado do teste indica de fato a estacionariedade da tendência (que apesar do nome não é estacionária).
Também concordo com Pantera que os efeitos sazonais podem distorcer o resultado. A série poderia, na realidade, ser um processo de tendência temporal + sazonais determinísticos + raiz estocástica da unidade, mas o teste ADF pode interpretar mal as flutuações sazonais como reversões estocásticas da tendência determinística, o que implicaria raízes menores que a unidade. (Por outro lado, considerando que você incluiu atrasos suficientes, isso deve aparecer como raízes de unidade (falsas) em frequências sazonais, não na frequência zero / longo prazo que o teste do ADF analisa. Em qualquer caso, dado o padrão sazonal, é melhor incluir os sazonais.)
fonte