Chris Chatfield, cujos livros e documentos de qualidade eu gostei de ler, em (1) dá os seguintes conselhos:
Por exemplo, a escolha entre os modelos de séries temporais ARIMA com valores baixos e aproximadamente iguais da AIC provavelmente deve ser feita, não sobre o que acontece para fornecer a AIC mínima, mas sobre a qual fornece as melhores previsões dos dados do ano mais recente.
Qual é a justificativa para esse conselho? Se estiver correto, por que o forecast :: auto.arima e outras rotinas de previsão não o seguem? Ainda a ser implementado? Ele já foi discutido aqui que, para olhar para os modelos que só passou a dar o mínimo AIC provavelmente não é uma boa idéia. Por que a opção de ter modelos ARIMA com valores baixos, mas aproximadamente iguais (por exemplo, dentro de 1 ou 2 valores da AIC mínima) não é um padrão em grande parte do software de previsão de séries temporais?
(1) Chatfield, C. (1991). Evitando armadilhas estatísticas. Statistical Science, 6 (3), 240–252. Disponível online, URL: https://projecteuclid.org/euclid.ss/1177011686 .
fonte
Respostas:
É verdade que se você tiver vários valores de AIC aproximadamente iguais, selecionar o valor mais baixo pode não ser a melhor opção. Uma alternativa sensata seria realizar a média do modelo. Dessa forma, você pode usar não apenas o melhor modelo para inferência, mas também um conjunto de modelos "mais suportados", cada um deles ponderado de acordo com seu valor de AIC.
Você tem uma breve introdução de Vincent Calcagno aqui
fonte