Como interpretar gráficos de ACF e PACF

10

Eu só quero verificar se estou interpretando os gráficos ACF e PACF corretamente:

insira a descrição da imagem aqui

insira a descrição da imagem aqui

Os dados correspondem aos erros gerados entre os pontos de dados reais e as estimativas geradas usando um modelo AR (1).

Eu olhei para a resposta aqui:

Estimar coeficientes ARMA através da inspeção ACF e PACF

Depois de ler isso, parece que os erros não são autocorrelacionados, mas eu só quero ter certeza, minhas preocupações são:

1.) O primeiro erro está no limite (quando for esse o caso, devo aceitar ou rejeitar a existência de correlação automática significativa no atraso 1)?

2.) As linhas representam o intervalo de confiança de 95% e, considerando que existem 116 lags, eu não esperaria mais que (0,05 * 116 = 5,8, que arredondamos para 6) 6 lags excedam o limite. Para o ACF, este é o caso, mas para o PACF existem cerca de 10 exceções. Se você incluir aqueles na fronteira, é mais como 14? Isso ainda indica que não há correlação automática?

3.) Devo ler algo sobre o fato de que todas as violações do intervalo de confiança de 95% ocorrem em desvantagem?

Baz
fonte

Respostas:

9

Não há estrutura aparente nos gráficos que você mostra.

A ordem de atraso das autocorrelações parciais negativas que ficam fora das bandas não é múltipla uma da outra (são defasagens, 22, 56, 62, 78, 94), ou seja, elas não surgem após um número regular de defasagens, como por exemplo 12 , 24, 36, 48, então eu não inferiria nenhum padrão com base nisso na trama.

Como complemento, você pode aplicar um teste de execução , que é um teste de independência que pode ser útil para capturar execuções de valores positivos ou negativos, o que sugere algum padrão nos dados.

No que diz respeito à importância de algumas das correlações automáticas, vejo que elas surgem em grandes quantidades. Você deve pensar se essas autocorrelações fazem sentido ou podem ser esperadas no contexto de seus dados. É sensato esperar que o valor observado 56 observações atrás afete a observação atual? Se tivéssemos dados trimestrais, valeria a pena inspecionar correlações significativas nas defasagens 8 e 12, porque são múltiplos da periodicidade dos dados e podem refletir algum padrão sazonal que poderíamos explicar no contexto dos dados. Mas eu não me preocuparia muito se surgissem atrasos significativos nos atrasos 9, 11 ou muito mais altos, para os quais eu não tinha uma explicação que justificasse isso como um padrão regular.

javlacalle
fonte
2

O exame de correlograma dos resíduos (diferença entre o ponto de dados real e as estimativas) é realizado para verificar se algum padrão significativo sobre os dados não foi deixado de fora no modelo ARIMA. Se todas as informações foram capturadas, as plotagens ACF e PACF devem se parecer com ruído branco.

ACF e PACF para ruído branco

Se um exame visual não ajudar a assumir com confiança o mesmo, tente executar um teste de Box-Ljung nos resíduos.

A hipótese nula, neste cenário, para um teste de Box-Ljung será que os resíduos não são diferentes do ruído branco.

A seguir está o código para executar o teste em r:

Box.test(residuals, lag = 28, fitdf = 5, type = "Ljung")

O valor do atraso é definido com base no número de coeficientes de autocorrelação de atraso e fitdf é o número de graus de liberdade a serem subtraídos. Para um ARIMA (p, d, q) (P, D, Q) m, costumo definir fitdf = (p + q + P + Q)

Se um teste de Box-Ljung retornar um valor p grande, isso sugere que os resíduos não têm autocorrelações restantes, ou seja, se assemelham a ruído branco.

Amol Modi
fonte