Estimar coeficientes ARMA através da inspeção ACF e PACF

16

Como você estima o modelo de previsão apropriado para uma série temporal por inspeção visual dos gráficos ACF e PACF? Qual deles (ou seja, ACF ou PACF) diz ao AR ou ao MA (ou ambos)? Qual parte dos gráficos informa a parte sazonal e não sazonal de um ARIMA sazonal?

Considere as funções ACF e PCF exibidas abaixo. Eles são de uma série transformada em log que foi diferenciada duas vezes, uma diferença simples e uma sazonal ( dados originais , dados transformados em log ). Como você caracterizaria a série? Qual modelo se encaixa melhor?

insira a descrição da imagem aqui

4everlearning
fonte

Respostas:

12

Minha resposta é realmente uma abreviação de javlacelle, mas é longa demais para um simples comentário, mas não muito curta para ser inútil.

Embora a resposta de jvlacelle seja tecnicamente correta em um nível, ela "simplifica demais", pois pressupõe certas "coisas" que normalmente nunca são verdadeiras. Ele assume que não há estrutura determinística necessária, como uma ou mais tendências temporais OU uma ou mais mudanças de nível ou um ou mais pulsos sazonais ou um ou mais pulsos únicos. Além disso, assume que os parâmetros do modelo identificado são invariantes ao longo do tempo e o processo de erro subjacente ao modelo identificado experimentalmente também é invariante ao longo do tempo. Ignorar qualquer uma das opções acima é frequentemente (sempre na minha opinião!) Uma receita para o desastre ou, mais precisamente, um "modelo mal identificado". Um caso clássico disso é a transformação logarítmica desnecessária proposta para as séries de companhias aéreas e para as séries que o OP apresenta em sua pergunta revisada. Não há necessidade de nenhuma transformação logarítmica para seus dados, pois há apenas alguns valores "incomuns" nos períodos 198.207.218.219 e 256 que não foram tratados criam a falsa impressão de que há maior variação de erro em níveis mais altos. Observe que "valores incomuns" são identificados levando em consideração qualquer estrutura ARIMA necessária que muitas vezes escapa ao olho humano.Transformações são necessárias quando a variação de erro não é constante ao longo do tempo NÃO quando a variação do Y observado não é constante ao longo do tempo . Os procedimentos primitivos ainda cometem o erro tático de selecionar uma transformação prematuramente antes de qualquer um dos remédios mencionados acima. É preciso lembrar que a estratégia simples de identificação do modelo ARIMA foi desenvolvida no início dos anos 60, mas muitos desenvolvimentos / melhorias ocorreram desde então. 219 e 256, que não foram tratados, criam a falsa impressão de que há maior variação de erro em níveis mais altos. Observe que "valores incomuns" são identificados levando em consideração qualquer estrutura ARIMA necessária que muitas vezes escapa ao olho humano.Transformações são necessárias quando a variação de erro não é constante ao longo do tempo NÃO quando a variação do Y observado não é constante ao longo do tempo . Os procedimentos primitivos ainda cometem o erro tático de selecionar uma transformação prematuramente antes de qualquer um dos remédios mencionados acima. É preciso lembrar que a estratégia simples de identificação do modelo ARIMA foi desenvolvida no início dos anos 60, mas muitos desenvolvimentos / melhorias ocorreram desde então. 219 e 256, que não foram tratados, criam a falsa impressão de que há maior variação de erro em níveis mais altos. Observe que "valores incomuns" são identificados levando em consideração qualquer estrutura ARIMA necessária que muitas vezes escapa ao olho humano.Transformações são necessárias quando a variação de erro não é constante ao longo do tempo NÃO quando a variação do Y observado não é constante ao longo do tempo . Os procedimentos primitivos ainda cometem o erro tático de selecionar uma transformação prematuramente antes de qualquer um dos remédios mencionados acima. É preciso lembrar que a estratégia simples de identificação do modelo ARIMA foi desenvolvida no início dos anos 60, mas muitos desenvolvimentos / melhorias ocorreram desde então. são identificadas levando em consideração qualquer estrutura ARIMA necessária que frequentemente escapa ao olho humano. As transformações são necessárias quando a variação de erro não é constante ao longo do tempo, NÃO quando a variação do Y observado não é constante ao longo do tempo. Os procedimentos primitivos ainda cometem o erro tático de selecionar uma transformação prematuramente antes de qualquer um dos remédios mencionados acima. É preciso lembrar que a estratégia simples de identificação do modelo ARIMA foi desenvolvida no início dos anos 60, mas muitos desenvolvimentos / melhorias ocorreram desde então. são identificadas levando em consideração qualquer estrutura ARIMA necessária que frequentemente escapa ao olho humano. As transformações são necessárias quando a variação de erro não é constante ao longo do tempo, NÃO quando a variação do Y observado não é constante ao longo do tempo. Os procedimentos primitivos ainda cometem o erro tático de selecionar uma transformação prematuramente antes de qualquer um dos remédios mencionados acima. É preciso lembrar que a estratégia simples de identificação do modelo ARIMA foi desenvolvida no início dos anos 60, mas muitos desenvolvimentos / melhorias ocorreram desde então. Os procedimentos primitivos ainda cometem o erro tático de selecionar uma transformação prematuramente antes de qualquer um dos remédios mencionados acima. É preciso lembrar que a estratégia simples de identificação do modelo ARIMA foi desenvolvida no início dos anos 60, mas muitos desenvolvimentos / melhorias ocorreram desde então. Os procedimentos primitivos ainda cometem o erro tático de selecionar uma transformação prematuramente antes de qualquer um dos remédios mencionados acima. É preciso lembrar que a estratégia simples de identificação do modelo ARIMA foi desenvolvida no início dos anos 60, mas muitos desenvolvimentos / melhorias ocorreram desde então.

Editado após a publicação dos dados:

Um modelo razoável foi identificado usando http://www.autobox.com/cms/, que é um software que incorpora algumas das minhas idéias mencionadas à medida que ajudei a desenvolvê-lo. insira a descrição da imagem aquiO Teste de Chow para constância de parâmetros sugeriu que os dados fossem segmentados e que as últimas 94 observações fossem usadas como parâmetros do modelo mudaram ao longo do tempo. . É sabido, mas muitas vezes esquecido que as transformações de energia são como drogas ... o uso indevido pode prejudicá-lo. Finalmente, observe que o modelo tem uma estrutura AR (2), mas não uma estrutura AR (1).insira a descrição da imagem aqui.Estes últimos 94 valores produziram uma equação insira a descrição da imagem aquicom todos os coeficientes significativos. insira a descrição da imagem aqui. O gráfico dos resíduos sugere uma dispersão razoávelinsira a descrição da imagem aqui com o seguinte ACF sugerindo aleatoriedade insira a descrição da imagem aqui. O gráfico real e limpo está iluminado, pois mostra os sutis, mas significativos outliers. insira a descrição da imagem aqui. Por fim, um enredo real, adequado e previsto resume nosso trabalho TODOS SEM TOMAR LOGARITMOSinsira a descrição da imagem aqui

IrishStat
fonte
por que não podemos levar a transformação de log? Consulte o conjunto de dados AirPassengers em R, que possui sazonalidade multiplicativa. Tomando o log, o transforma em sazonalidade aditiva. Além disso, se não coletarmos logs, o conjunto de dados terá uma variação crescente, ou seja, não será estacionário. Como posso lidar com esse conjunto de dados sem fazer a transformação de log? Você pode explicar, por favor?
user2338823
"Não há necessidade de nenhuma transformação logarítmica para seus dados, pois existem apenas alguns valores" incomuns "em períodos que não foram tratados, criando a falsa impressão de que há maior variação de erro em níveis mais altos". a suposição de estacionariedade da constância da variação refere-se à variação do erro e não à variação da série original. O software R não permite identificar e incorporar anomalias automaticamente. consulte autobox.com/cms/index.php/blog discussão sobre a série. E autobox.com/pdfs/vegas_ibf_09a.pdf
IrishStat
O teste de Box-Cox para uma transformação de potência NÃO ASSUME valores discrepantes, portanto, ele pode vincular de forma incorreta / inadvertida a variação de variação ao valor esperado, sugerindo incorretamente a necessidade de uma transformação. Veja o artigo de Tsay, docplayer.net/…, de um dos alunos de Box, como uma introdução para lidar com a estrutura determinística latente não tratada. Adeus, se você não / não puder lidar com uma violação do primeiro momento, poderá ajustar incorretamente para variação de variação através de uma transformação de poder ou GLS, como Tsay aponta.
IrishStat
14

Apenas para esclarecer conceitos, por inspeção visual do ACF ou PACF, você pode escolher (não estimar) um modelo ARMA provisório. Após a seleção de um modelo, é possível estimar o modelo maximizando a função de probabilidade, minimizando a soma dos quadrados ou, no caso do modelo de RA, por meio do método dos momentos.

Um modelo ARMA pode ser escolhido após a inspeção do ACF e PACF. Essa abordagem se baseia nos seguintes fatos: 1) o ACF de um processo estacionário de RA da ordem p passa a zero a uma taxa exponencial, enquanto o PACF torna-se zero após o atraso p. 2) Para um processo MA de ordem q, o ACF teórico e o PACF exibem o comportamento inverso (o ACF trunca após o atraso q e o PACF chega a zero relativamente rápido).

Geralmente é claro detectar a ordem de um modelo de AR ou MA. No entanto, com processos que incluem uma parte AR e MA, o atraso no qual eles são truncados pode ficar desfocado porque o ACF e o PACF decairão para zero.

Uma maneira de proceder é ajustar primeiro um modelo de AR ou MA (aquele que parece mais claro no ACF e PACF) de baixa ordem. Então, se houver alguma estrutura adicional, ela aparecerá nos resíduos; portanto, o ACF e PACF dos resíduos é verificado para determinar se termos adicionais de AR ou MA são necessários.

Normalmente, você terá que tentar diagnosticar mais de um modelo. Você também pode compará-los consultando a AIC.

O ACF e o PACF que você postou primeiro sugeriram um ARMA (2,0,0) (0,0,1), ou seja, um AR regular (2) e um MA sazonal (1). A parte sazonal do modelo é determinada da mesma forma que a parte regular, mas observando as defasagens da ordem sazonal (por exemplo, 12, 24, 36, ... nos dados mensais). Se você estiver usando R, é recomendável aumentar o número padrão de defasagens exibidas acf(x, lag.max = 60).

O gráfico que você mostra agora revela correlação negativa suspeita. Se esse gráfico é baseado no mesmo que no gráfico anterior, você pode ter feito muitas diferenças. Veja também este post .

Você pode obter mais detalhes, entre outras fontes, aqui: Capítulo 3 em Time Series: Theory and Methods, de Peter J. Brockwell e Richard A. Davis, e aqui .

javlacalle
fonte
Você está certo. Eu posso ter tomado uma diferença demais. Eu tenho uma dúvida embora. Fiz uma diferença simples ( i.imgur.com/1MjLzlX.png ) e uma sazonal (12) ( i.imgur.com/E64Sd7p.png ) nos dados do log. Qual deles devo olhar, o sazonal, certo?
4everlearning
11
@ 4everlearning Certo, depois de considerar as diferenças sazonais, o ACF e o PACF parecem mais próximos do que poderíamos esperar de um processo estacionário. Você pode começar ajustando um ARIMA (2,0,0) (0,1,1), em R arima(x, order = c(2,0,0), seasonal = list(order = c(0,1,1))), e exibindo o ACF e PACF dos resíduos. Esteja ciente de outras questões levantadas pelo IrishStat com as quais você deve se preocupar na análise.
Javlacalle
Obrigado. Como eu iria encontrar esses pedidos de AR e MA? Além disso, o Critério de informação de Akaike gera um valor negativo para o meu modelo. Entendo que isso não é importante, embora não tenha muita certeza de como compará-lo com outros modelos, digamos AIC = -797,74 e AIC = -800,00. Qual é preferível?
4everlearning
Você pode determinar os pedidos seguindo a ideia dada na resposta acima. Se você perceber que o ACF chega a zero relativamente rápido e o PACF trunca após o atraso 2, é provável que uma estrutura AR (2) esteja presente nos dados. A idéia inversa se aplica à detecção de um MA. Como recomendação geral, comece com um modelo de ordem baixa e inspecione os resíduos que procuram estruturas de AR ou MA a serem adicionadas ao modelo inicial.
Javlacalle
Como regra geral, quanto menor a AIC, melhor o modelo (supondo que você esteja usando os dados na mesma escala nos dois modelos, ou seja, a série deve estar em níveis ou em todos os modelos que você está comparando )
Javlacalle