Procurando certo tipo de explicação ARIMA

25

Pode ser difícil de encontrar, mas eu gostaria de ler um exemplo bem explicado do ARIMA que

  • usa matemática mínima

  • estende a discussão para além da construção de um modelo, usando-o para prever casos específicos

  • usa gráficos e resultados numéricos para caracterizar o ajuste entre os valores previstos e reais.

rolando2
fonte

Respostas:

7

Minha leitura sugerida para uma introdução à modelagem ARIMA seria

Análise Aplicada de Séries Temporais para as Ciências Sociais 1980 por R McCleary; RA Hay; EE Meidinger; D McDowall

Isso é direcionado a cientistas sociais, para que as demandas matemáticas não sejam muito rigorosas. Também para tratamentos mais curtos, sugiro dois Sage Green Books (embora sejam totalmente redundantes com o livro de McCleary),

O texto Ostrom é apenas modelagem ARMA e não discute previsões. Também não acho que eles atendam aos seus requisitos para erros gráficos de previsão. Tenho certeza de que você pode desenterrar recursos mais úteis examinando também as perguntas marcadas com séries temporais neste fórum.

Andy W
fonte
O livro de McCleary é maravilhosamente escrito, conciso e realmente uma boa introdução. Há também um humor não intencional maravilhoso no último capítulo, onde eles falam sobre idiomas de alto nível como o Fortran.
Richiemorrisroe
31

Tentarei responder ao gentil desejo do whuber de simplesmente "responder à pergunta" e permanecer no tópico. Recebemos 144 leituras mensais de uma série chamada "The Airline Series". Box e Jenkins foram amplamente criticados por fornecerem uma previsão muito alta devido à “natureza explosiva” de uma transformação registrada reversa.insira a descrição da imagem aqui

Visualmente, temos a impressão de que a variação da série original aumenta com o nível da série, sugerindo a necessidade de uma transformação. No entanto, sabemos que um dos requisitos para um modelo útil é que a variação dos "erros de modelo" precise ser homogênea. Nenhuma suposição é necessária sobre a variação da série original. Eles são idênticos se o modelo for simplesmente uma constante, ou seja, y (t) = u. Como /stats//users/2392/probabilityislogic afirmou tão claramente em sua resposta ao conselho sobre explicação de heterogeneidade / heterocedasticidade, “uma coisa que eu sempre acho divertida é essa" não normalidade dos dados "que as pessoas preocupam sobre. Os dados não precisam ser distribuídos normalmente, mas o termo do erro precisa ”

O trabalho inicial de séries temporais muitas vezes erroneamente chegou a conclusões sobre transformações injustificadas. Descobriremos aqui que a transformação corretiva para esses dados é simplesmente adicionar três séries fictícias de indicadores ao modelo ARIMA, refletindo um ajuste para três pontos de dados incomuns. A seguir, é apresentado o gráfico da função de autocorrelação, sugerindo uma forte autocorrelação no atraso 12 (0,76) e no atraso 1 (0,948). As autocorrelações são simplesmente coeficientes de regressão em um modelo em que y é a variável dependente prevista por um atraso de y.

insira a descrição da imagem aqui! insira a descrição da imagem aqui

A análise acima sugere que se modele as primeiras diferenças da série e estude essa "série residual", que é idêntica às primeiras diferenças primeiro por suas propriedades. insira a descrição da imagem aqui

Essa análise confirma a ideia de que existe um forte padrão sazonal nos dados que poderiam ser remediados ou modelados por um modelo que continha dois operadores diferentes.

insira a descrição da imagem aqui insira a descrição da imagem aqui

Essa diferenciação dupla simples produz um conjunto de resíduos, também conhecido como série ajustada, ou que fala vagamente uma série transformada que evidencia variação não constante, mas a razão para a variação não constante é a média não constante dos resíduos. série duplamente diferenciada, sugerindo três anomalias no final da série. A autocorrelação desta série indica falsamente que "está tudo bem" e pode haver necessidade de qualquer ajuste de Ma (1). Deve-se tomar cuidado, pois há uma sugestão de anomalias nos dados, portanto, a ACF é enviesada para baixo. Isso é conhecido como “Efeito Alice no País das Maravilhas”, ou seja, aceitar a hipótese nula de nenhuma estrutura evidenciada quando essa estrutura está sendo mascarada por uma violação de uma das suposições.

insira a descrição da imagem aqui insira a descrição da imagem aqui

Detectamos visualmente três pontos incomuns (117.135.136)

insira a descrição da imagem aqui

Essa etapa de detecção dos outliers é chamada de Detecção de intervenção e pode ser facilmente, ou não tão facilmente, programada após o trabalho de Tsay.

insira a descrição da imagem aquiinsira a descrição da imagem aqui

Se adicionarmos três indicadores ao modelo, obteremos insira a descrição da imagem aqui

Podemos então estimar

insira a descrição da imagem aqui

E receba um gráfico dos resíduos e do acf

insira a descrição da imagem aqui

insira a descrição da imagem aqui

Essa avaliação sugere que adicionemos potencialmente dois coeficientes médios móveis ao modelo. Assim, o próximo modelo estimado pode ser.

insira a descrição da imagem aqui

Produzindo

insira a descrição da imagem aqui

insira a descrição da imagem aqui

insira a descrição da imagem aqui insira a descrição da imagem aqui insira a descrição da imagem aqui Pode-se então excluir a constante não significativa e obter um modelo refinado: insira a descrição da imagem aqui

Observamos que nenhuma transformação de energia foi necessária para obter um conjunto de resíduos com variação constante. Observe que as previsões não são explosivas.

insira a descrição da imagem aqui

insira a descrição da imagem aqui

Em termos de uma soma ponderada simples, temos: 13 pesos; 3 diferente de zero e igual a (1.0.1,0., - 1,0)

insira a descrição da imagem aqui

insira a descrição da imagem aqui

Este material foi apresentado de uma maneira não automática e, consequentemente, exigiu a interação do usuário em termos de tomada de decisões de modelagem.

IrishStat
fonte
Olá, IrishStat, sou eu de novo. Adorei seu extenso exemplo, mas há duas passagens que são um pouco obscuras (pelo menos para mim): "A autocorrelação desta série indica falsamente que" está tudo bem "e pode haver necessidade de qualquer ajuste de Ma (1) "e" Esta ACF sugere que adicionemos potencialmente dois coeficientes médios móveis ao modelo ". Exatamente o que você vê naqueles gráficos da ACF que fazem você acreditar nisso? Os dois não parecem bons (quase todos os valores estão dentro das "linhas azuis")?
Bruder
: VBruder Acho que estava "errado" com a afirmação "pode ​​haver um ....." No segundo exemplo, há evidências de "bad acf" nos lag1 e lag 12, sugerindo a necessidade potencial dos coeficientes t2o ma . Você acredita demais nesses limites quando boyh, o acf91) e o acf (12) estão "perigosamente próximos". Você pode entrar em contato comigo diretamente no meu endereço de e-mail publicado disponível em minhas informações.
IrishStat
Bom escrever. "Modelo ARIMA que reflete um ajuste para três pontos de dados incomuns" Você diz que adiciona três variáveis ​​fictícias para esses três pontos? Em termos leigos, como esses três outlier são contabilizados em previsões futuras? (Tenho certeza de que é simples, mas não estou familiarizado com isso.) Além disso, parece que os limites de erro não aumentam com o passar do tempo. (Ou talvez o erro vinculado dependa da modalidade da etapa?) Agradecemos antecipadamente.
Adam
@ Adam, as três variáveis ​​fictícias não desempenham nenhum papel na previsão, pois os valores futuros são todos 0. Sim, os limites de erro apresentados estão incorretos. Resolvemos essa falha e agora a AUTOBOX apresenta limites crescentes de erros com o passar do tempo. Eu sou um dos desenvolvedores da AUTOBOX. .
IrishStat
@IrishStat "as três variáveis ​​fictícias não desempenham nenhum papel na previsão, pois os valores futuros são todos 0." Isso significa essencialmente que eles são extraídos dos dados? Eles devem ter algum impacto nos limites de previsão?
Adam
15

Eu tentei fazer isso no capítulo 7 do meu livro de 1998 com Makridakis & Wheelwright. Se eu consegui ou não, deixarei os outros para julgar. Você pode ler alguns dos capítulos on-line via Amazon (da p311). Procure por "ARIMA" no livro para convencer a Amazon a mostrar as páginas relevantes.

Atualização: tenho um novo livro gratuito e online. O capítulo ARIMA está aqui .

Rob Hyndman
fonte
3

Eu recomendaria o Forecasting with Univariate Box - Jenkins Models: Concepts and Cases por Alan Pankratz. Este livro clássico tem todos os recursos que você solicitou:

  • usa matemática mínima
  • estende a discussão para além da construção de um modelo, usando-o para prever casos específicos
  • usa gráficos e resultados numéricos para caracterizar o ajuste entre os valores previstos e reais.

A única desvantagem é que ela foi impressa em 1983 e pode não ter alguns desenvolvimentos recentes. A editora está lançando uma segunda edição em janeiro de 2014 com atualizações.

previsor
fonte
Eu também recomendaria o outro livro de Alan Pankratz: Forecasting with Dynamic Regression Models. Material muito semelhante, mas cobre um pouco mais de terreno; embora com menos detalhes do lado das coisas de Box-Jenkins. É bom saber que haverá uma 2ª edição em janeiro de 2014!
Graeme Walsh
-4

Um modelo ARIMA é simplesmente uma média ponderada. Responde à dupla pergunta;

  1. Quantos períodos (k) devo usar para calcular uma média ponderada

e

  1. Com precisão quais são os pesos k

Ele responde à oração da donzela para determinar como se ajustar aos valores anteriores (e valores anteriores SOZINHO) para projetar a série (que está realmente sendo causada por variáveis ​​causais não especificadas). Assim, um modelo ARIMA é um modelo causal de homem pobre.

IrishStat
fonte
-1 Esta resposta parece não responder à pergunta, que procura um "exemplo bem explicado ... * *".
whuber
@ whuber: O OP pediu uma resposta que "use matemática mínima". Minha resposta detalhou matemática mínima e foi motivada a explicar os modelos ARIMA em palavras comuns do dia a dia. Isso nunca é feito como a teoria matemática caras se concentrar na "explicação high-end", usando, operadores diferenciais polinomiais, não-linear otimização etc.
IrishStat
@Irish Concordo com a motivação para manter a matemática baixa, especialmente quando solicitado pelo usuário. Mas essa resposta parece responder a uma pergunta diferente: "o que é ARIMA". A natureza específica da pergunta original também indica que o OP tem uma boa idéia do que é o ARIMA e para que serve; eles querem vê-lo em ação. Aposto que você poderia facilmente contribuir com um estudo de caso :-).
whuber
: whuber: Isso teria sido muito fácil para mim e eu poderia fazer isso.
IrishStat
@ Irish Estou ansioso para vê-lo. Além disso - esse problema não apareceu aqui, mas em outros lugares - essas contribuições são potencialmente mais poderosas e mais apreciadas, para que as pessoas saibam o que você pode fazer do que muitas outras formas de marketing.
whuber