Modelo de série temporal do conjunto

13

Preciso automatizar a previsão de séries temporais e não conheço antecipadamente os recursos dessas séries (sazonalidade, tendência, ruído etc.).

Meu objetivo não é obter o melhor modelo possível para cada série, mas evitar modelos muito ruins. Em outras palavras, obter pequenos erros toda vez não é um problema, mas obter grandes erros de vez em quando é.

Eu pensei que poderia conseguir isso combinando modelos calculados com diferentes técnicas.

Ou seja, embora o ARIMA seja a melhor abordagem para uma série específica, ele pode não ser o melhor para outra série; o mesmo para suavização exponencial.

No entanto, se eu combinar um modelo de cada técnica, mesmo que um modelo não seja tão bom, o outro aproximará a estimativa do valor real.

É sabido que o ARIMA funciona melhor em séries bem comportadas de longo prazo, enquanto a suavização exponencial se destaca nas séries ruidosas de curto prazo.

  • Minha idéia é combinar modelos gerados pelas duas técnicas para obter previsões mais robustas, faz sentido?

Pode haver muitas maneiras de combinar esses modelos.

  • Se essa é uma boa abordagem, como devo combiná-las?

Uma média simples de previsões é uma opção, mas talvez eu possa obter melhores previsões se ponderar a média de acordo com alguma medida de bondade do modelo.

  • Qual seria o tratamento da variância ao combinar modelos?
João Daniel
fonte
Suas idéias são ótimas, mas não tenho tanta certeza sobre o uso de modelos ARIMA que se ajustam automaticamente . Para séries univariadas, talvez ... A sabedoria convencional é que Holt-Winters é bastante robusto usado automaticamente, de modo que poderia ser sua base para comparações fora da amostra entre métodos.
Scortchi - Restabelece Monica
@ Scortchi Esqueci de mencionar que todas as séries são univariadas! ;) Concordo que Holt-Winters apresenta um desempenho muito bom quando usado automaticamente, mas pretendo obter mais uma opinião de outro modelo, para evitar casos em que as previsões não são tão boas. Às vezes, o HW mostra um comportamento de tendência estranho.
João Daniel
1
Mesmo no caso univariado, luto para imaginar um procedimento automático - há tendência (estocástica ou determinística), possíveis transformações, sazonalidade (multiplicativa ou aditiva) em que pensar, e acho que, para chegar a um modelo, uso muito conhecimento prévio sobre o que seria sensato para o que uma série específica representa na realidade. Ainda assim, a prova do pudim está na comida - eu realmente queria dizer para não esquecer comparações fora da amostra com técnicas simples - então, boa sorte com isso.
Scortchi - Restabelece Monica

Respostas:

15

Combinar previsões é uma excelente ideia. (Eu acho que não é exagero dizer que essa é uma das poucas coisas que os analistas acadêmicos concordam.)

Por algum tempo, escrevi um artigo analisando diferentes maneiras de ponderar as previsões ao combiná-las: http://www.sciencedirect.com/science/article/pii/S0169207010001032 Basicamente, o uso de pesos (Akaike) não melhorava consistentemente as combinações sobre meios ou medianas simples ou aparadas / com tamanho de vitórias, então eu pessoalmente pensaria duas vezes antes de implementar um procedimento complexo que pode não gerar um benefício definido (lembre-se, porém, que as combinações superaram consistentemente os métodos únicos de seleção por critérios de informação). Isso pode depender da série temporal específica que você possui, é claro.

Eu olhei para combinar intervalos de previsão no artigo acima, mas não para combinar variação como tal. Parece que me lembro de um artigo não muito tempo atrás na IJF com esse foco; portanto, você pode procurar por "combinação" ou "combinação" nas edições anteriores da IJF.

Alguns outros artigos que analisaram a combinação de previsões estão aqui (desde 1989, mas uma revisão) e aqui e aqui (também analisam as densidades) e aqui e aqui. Muitos deles observam que ainda é pouco compreendido por que as combinações de previsão frequentemente superam os modelos selecionados únicos. O penúltimo artigo é sobre a competição de previsão do M3; uma de suas principais descobertas foi (número (3) na p. 458) que "A precisão da combinação de vários métodos supera, em média, os métodos específicos que estão sendo combinados e se sai bem em comparação com outros métodos". O último desses trabalhos conclui que as combinações não têm necessariamente um desempenho melhor que os modelos únicos, mas podem reduzir consideravelmente o risco de falha catastrófica (que é um dos seus objetivos). Mais literatura deve ser encontrada facilmente no International Journal of Forecasting , o Journal of Forecasting e para aplicações mais específicas na literatura sobre econometria ou cadeia de suprimentos.

Stephan Kolassa
fonte
1
Excelente ponto de vista sobre a combinação de modelos! Sua resposta foi muito construtiva!
João Daniel
@ Stephan Kolassa, você teria algum comentário sobre a combinação de preditores para frente e para trás, como no método de Burg?
Denis
@denis: Eu não estou familiarizado com preditores avançados ou reversos, nem com o método de Burg, desculpe ... embora eu assuma que a combinação de previsões / previsões (também conhecidos como métodos de conjunto) geralmente será benéfica.
precisa saber é o seguinte
Olá Stephan, ótimo artigo. Parece que o site do diário mudou e não parece mais possível fazer o download do seu código R no site principal. A hospedagem está em um site diferente agora?
31415 Ian
@ Ian: você pode não ter acesso a ele se não se inscrever. Envie-me um email ( encontre meu endereço aqui ), enviarei os scripts. Dê-me alguns dias para desenterrá-los.
Stephan Kolassa
1

Por que não especificar mais? Eu não acho que qualquer modelo que você produza poderia ser melhor ou bom o suficiente do que uma escolha específica.

Com isso dito, se você pode restringir um pouco suas escolhas àquelas para as quais pode testar e a entrada de dados pode ser padronizada, por que não escrever um procedimento de teste automatizado em R?

Digamos que você decida que seus dados estarão dentro de um intervalo a ser estimado por cinco modelos, além de um "fallback". Digamos que você possa caracterizar a entrada por diferentes testes. Então vá em frente e escreva um algoritmo R (ou um programa como esse) que execute isso para você. Isso funciona se você puder produzir um fluxograma cujo modelo seja executado com base nos dados de teste, ou seja, se algum ponto da árvore de decisão for binário.

Se isso não for uma opção porque a decisão pode não ser binária, sugiro que você implemente um sistema de classificação com base nos testes aplicáveis ​​e execute alguns dados simulados de "casos extremos" em sua grade para ver se os resultados são o que você está procurando.

Você pode combinar essas coisas obviamente, por exemplo, o teste de não estacionariedade pode dar um definitivo sim-não, enquanto outros atributos podem cair em um intervalo, como multicolinearidade.
Você pode desenhar isso no papel primeiro e depois construí-lo, simulá-lo com distribuições conhecidas que você espera ter.

Em seguida, basta executar o programa R sempre que novos dados chegarem. Não vejo necessidade de combinar vários modelos com os recursos computacionais que você provavelmente tem em mãos.

EU SOU UM
fonte
Restringir as opções é uma boa idéia, como não usar métodos não sazonais se os dados forem obviamente sazonais. Mas, mesmo assim, eu argumentaria que a média de vários modelos sazonais (sazonalidade aditiva versus sazonal multiplicativa, com ou sem tendência etc.) melhorará , em média, a precisão da previsão. Pelo menos é essa a impressão que recebo de bastante exposição à comunidade de previsões, bem como às competições de previsão do M3 e similares.
perfil completo de Stephan Kolassa
Você tem documentos adicionais sobre isso? Quero dizer que este seria um assunto de pesquisa direto e relevante. Ideia muito interessante, embora apenas intuitivamente não concorde que necessariamente seria melhor do que uma grade dinâmica de modelos.
IMA 18/01
Bom ponto. Editei minha resposta para incluir um parágrafo adicional com mais indicadores de literatura. Concordo que isso é direto e relevante, e ainda não se sabe por que a média da previsão geralmente melhora a precisão.
Stephan Kolassa
Sim, quero dizer, você pode modelar todos os tipos de problemas distributivos e atacá-los computacionalmente e fundamentalmente. Obrigado pelos papéis, muito interessantes.
IMA
0

Há uma fórmula simples e agradável para combinar dois métodos de previsão, basta ponderá-los multiplicando o primeiro por um e o outro por (1 - a), onde a é encontrado minimizando a variação dessa previsão combinada. Como você conhece os erros dos dois métodos de previsão, é possível calcular os erros da combinação que dependerão de "a". O cálculo é simples quando a média de cada método é = 0. Para combinar mais de 2 métodos, as fórmulas ainda são "simples" no sentido de que você pode calculá-lo analiticamente "manualmente" ou também usar a opção Solver do EXCEL

Juan Jose Illingworth
fonte
Você pode dar referência a este método.
amigos estão dizendo sobre horace