Ao ler as postagens neste site, sei que há uma função R auto.arima
(no forecast
pacote ). Sei também que o IrishStat , membro deste site, criou o autobox do pacote comercial no início dos anos 80. Como esses dois pacotes existem hoje e selecionam automaticamente modelos de arima para determinados conjuntos de dados, o que eles fazem de diferente? Eles possivelmente produzirão modelos diferentes para o mesmo conjunto de dados?
time-series
arima
automatic-algorithms
Michael R. Chernick
fonte
fonte
auto.arima
funções disponíveis em outros pacotes, mas definitivamente há uma emforecast
cuja descrição é: "Retorna o melhor modelo ARIMA de acordo com ao valor AIC, AICc ou BIC. A função realiza uma pesquisa no modelo possível dentro das restrições de pedidos fornecidas. "Respostas:
michael / wayne
A AUTOBOX entregaria / identificaria definitivamente um modelo diferente se uma ou mais das seguintes condições fossem atendidas
1) existem pulsos nos dados
2) há 1 ou mais mudanças de nível / etapa nos dados
3) se houver pulsos sazonais nos dados
4) existem 1 ou mais tendências da hora local nos dados que não são simplesmente remediadas
5) se os parâmetros do modelo mudarem com o tempo
6) se a variação dos erros mudar ao longo do tempo e nenhuma transformação de energia for adequada.
Em termos de um exemplo específico, sugiro que vocês selecionem / criem uma série temporal e publiquem ambos na Web. Usarei a AUTOBOX para analisar os dados em um modo autônomo e publicarei os modelos na lista. Em seguida, você executa o programa R e, em seguida, cada um de vocês faz uma análise objetiva separada dos dois resultados, apontando semelhanças e diferenças. Envie esses dois modelos com todo o material de suporte disponível, incluindo os termos finais de erro para meus comentários. Resuma e apresente esses resultados à lista e peça aos leitores da lista que VOTEM pelo procedimento que lhes parecer melhor.
fonte
Eles representam duas abordagens diferentes para dois problemas semelhantes, mas diferentes. Eu escrevi
auto.arima
e @IrishStat é o autor deAutobox
.auto.arima()
se encaixa nos modelos ARIMA (sazonais), incluindo termos de desvio.Autobox
adapta-se aos modelos de função de transferência para lidar com mudanças de nível e valores extremos. Um modelo ARIMA é um caso especial de um modelo de função de transferência.Mesmo se você desativasse as mudanças de nível e a detecção de outlier
Autobox
, obteria um modelo ARIMA diferenteauto.arima()
devido a diferentes opções de como identificar os parâmetros ARIMA.Nos meus testes com os dados da concorrência M3 e M,
auto.arima()
produz previsões mais precisas do queAutobox
para esses dados. No entanto,Autobox
o desempenho será melhor com dados que contenham discrepâncias importantes e mudanças de nível.fonte
EDIT: Por seu comentário, acredito que se você desativar muitas das
autobox
opções, provavelmente obterá uma resposta semelhanteauto.arima
. Mas se não, e na presença de discrepantes, haverá definitivamente uma diferença:auto.arima
não se importa com discrepantes, enquantoautobox
os detecta e os manipula adequadamente, o que daria um modelo melhor. Também pode haver outras diferenças, e tenho certeza que o IrishStat pode descrevê-las.Acredito que
autobox
detecta outliers e outras coisas além de apenas procurar os melhores coeficientes de AR, I e MA. Se isso estiver correto, seria necessário mais análises e algumas outras funções R para ter uma funcionalidade semelhante. O IrishStats é um membro valioso dessa comunidade e bastante amigável.Obviamente, o R é gratuito e pode fazer um monte de coisas além do ARIMA.
Outra opção livre para o ARIMA
X13-ARIMA SEATS
, no estilo econômico , é o US Census Bureau, que é de código aberto. Existem binários para Windows e Linux, mas ele foi compilado diretamente no meu Mac, já que eu já havia carregado o compilador gfortran do gnu. É o sucessorX12-ARIMA
e foi lançado nos últimos dias, depois de anos de desenvolvimento e teste. (Ele atualiza o X12 e também adiciona recursos do SEATS / TRAMO. O X12 é a ferramenta oficial dos EUA, enquanto o SEATS / TRAMO é do Banco da Espanha e é a "ferramenta européia".)Eu realmente gosto muito do X12 (e agora do X13). Se você produz uma quantidade razoável de diagnósticos, lê-los e aprende o que eles significam, eles são realmente uma educação bastante boa sobre o ARIMA e as séries temporais. Desenvolvi meu próprio fluxo de trabalho, mas há um pacote R
x12
para fazer a maior parte do trabalho no R (você ainda precisa criar o arquivo do modelo de entrada (".spc") para o X12).Eu digo que o X12 é bom no ARIMA "estilo econômico", para significar dados mensais com mais de 3 anos de dados. (Você precisa de mais de 5 anos de dados para usar alguns recursos de diagnóstico.) Possui um recurso de identificação discrepante, pode lidar com todos os tipos de especificações discrepantes e pode lidar com feriados, feriados flutuantes, efeitos de dias de negociação e uma série de aspectos econômicos. É a ferramenta que o governo dos EUA usa para criar dados com ajuste sazonal.
fonte
autobox
obterá a mesma resposta. Mas um dos pontos de usoautobox
é que ele detectará discrepâncias e as manipulará como tal; portanto, o modelo retornado seria diferente se houver discrepâncias.