Suponha que eu tenha uma série temporal que eu quero ajustar usando um modelo ARIMA (1,1,0) do formulário:
Isso pode ser reescrito como:
A última equação descreve um modelo AR (2) com coeficientes e . Eu reconheço que, dependendo da, esse modelo AR (2) pode não ser estacionário. No entanto, se eu estava usando um diff, a série que estou modelando não deveria ser estacionária.
Eu sei que, se o modelo não for estacionário, um diff deve ser usado. Mas como os resultados difeririam se eu usasse um modelo AR (2) versus um modelo ARIMA (1,1,0)? Suponho (como sugerido por R) que ele tem um problema de convergência. No entanto, quando peço que R realize os ajustes, ele fará os dois e os coeficientes são (na maioria) consistentes com minhas observações acima. As previsões são definitivamente diferentes, no entanto.
Se alguém pudesse esclarecer isso ou me indicar uma boa referência, eu agradeceria.
Aqui está o código R que eu usei para gerar os dois modelos.
> set.seed(2)
> x <- arima.sim(n = 1000, model=list(order=c(1,1,0), ar=c(0.3)))
> plot(x)
> arima(x, order=c(1,1,0))
Call:
arima(x = x, order = c(1, 1, 0))
Coefficients:
ar1
0.3291
s.e. 0.0298
sigma^2 estimated as 1.03: log likelihood = -1433.91, aic = 2871.81
> arima(x, order=c(2,0,0))
Call:
arima(x = x, order = c(2, 0, 0))
Coefficients:
ar1 ar2 intercept
1.3290 -0.3294 50.9803
s.e. 0.0298 0.0299 35.9741
sigma^2 estimated as 1.03: log likelihood = -1438.93, aic = 2885.86
Warning messages:
1: In log(s2) : NaNs produced
2: In log(s2) : NaNs produced
3: In log(s2) : NaNs produced
4: In arima(x, order = c(2, 0, 0)) :
possible convergence problem: optim gave code = 1
fonte
Respostas:
A previsão para o ARIMA (1,1,0) impõe a restrição qued= 1 .
Talvez seja ainda mais fácil ver no caso AR (1) vs. ARIMA (0,1,0): O último é apenas
Portanto, como não esperamos mudanças aqui, a previsão ideal para uma caminhada aleatória éyT (T sendo o último na observação da amostra) para todos h = T+ 1 , … .
Se, por outro lado, ajustamos um modelo AR (1), obtemos uma estimativaα^ e produzir as previsões ideais a partir de um modelo AR (1) como
fonte
A equivalência depende das definições. O processo geral ARMA (p, q) pode ser definido como um processo estocástico, que é a solução para a seguinte equação:
OndeZt é um processo de ruído branco. Devemos exigir que os polinômiosϕ(z)=1−ϕ1z−...−ϕpzp e θ(z)=1+θ1z+...θpzp não deve ter raízes comuns, para que a equação seja definida exclusivamente.
Agora surge a pergunta, quando esta equação tem uma solução. A resposta depende das propriedades dos polinômiosϕ(z) e θ(z) . A equação tem uma solução estacionária, quando os polinômios não têm raízes no círculo unitário.
Portanto, nesse sentido, o ARIMA (1,1,0) não é um processo AR (2), porque não é estacionário. Pode ser escrito como satisfazendo a equação AR (2), mas como os polinômios têm uma raiz em um círculo unitário, você não pode resolver a equação. No entanto, se o polinômioϕ(z) tem uma raiz unitária, então ΔXt satisfaz a equação ARMA (p-1, q) (com polinômios diferentes). Portanto, é possível resolver paraΔXt e volte para Xt . Para marcar essa diferença, a notação ARIMA (p, d, q) é usada.
Então, para resumir, se definirmos estritamente um processo ARMA (p, q) como uma solução estacionária para a equação ARMA (p, q), ARIMA (1,1,0) e AR (2) não serão equivalentes.
O fato de R conseguir encontrar os coeficientes corretos é uma propriedade interessante da estimativa, ou seja, é possível mostrar que, no caso de raízes unitárias, o OLS [1] fornecerá estimativas consistentes dos coeficientes, porém a inferência seria incorreta. , como as distribuições limitantes não são normais. Os testes do ADF são baseados nessas estimativas. No entanto, a matemática real para mostrar que as estimativas estão corretas é bastante complicada e depende de certas suposições. Essas suposições não generalizam bem, portanto, não é aconselhável usar métodos usuais de estimativa para processos de raiz unitária.
[1] O MLE e o OLS são equivalentes às especificações do tipo AR (p).
fonte