Previsão de séries temporais Arima (auto.arima) com várias variáveis ​​exógenas em R

14

Eu gostaria de realizar uma previsão com base em um modelo ARIMA de várias séries temporais com várias variáveis ​​exógenas. Como não sou tão habilidoso em relação a estatísticas nem ao RI, quero mantê-lo o mais simples possível (a previsão de tendências por três meses é suficiente).

Eu tenho 1 série temporal dependente e 3-5 séries cronológicas preditivas, todos os dados mensais, sem lacunas, no mesmo "horizonte" temporal.

Encontrei a função auto.arima e me perguntei se essa seria uma solução adequada para o meu problema. Eu tenho diferentes preços de commodities e preços de produtos feitos a partir deles. Todos os dados brutos não são estacionários, mas por diferenciação de primeira ordem, todos eles se tornam dados estacionários. ADF, KPSS indicam isso. (Isso significa que eu testei para integração, certo?).

Minha pergunta agora é: Como aplico isso com a função auto.arima E o ARIMA é a abordagem correta de qualquer maneira? Algumas pessoas já me aconselharam a usar o VAR, mas é possível com o ARIMA também?

A tabela a seguir é meus dados. Na verdade, o conjunto de dados sobe para 105 observações, mas as 50 primeiras serão suficientes. Tendência e sazonalidade são obviamente interessantes aqui.

insira a descrição da imagem aqui

Obrigado por todos os conselhos e ajuda! Georg

George
fonte
publique seus dados para que possam ser baixados. use o excel. Isso poderia ser simplesmente uma tarefa para identificar séries de entradas desnecessárias (possivelmente correlacionadas significativamente). Eu não acho que o VAR é necessário ou os componentes principais são úteis para esse problema
IrishStat

Respostas:

10

y

Para auto.arima()trabalhar com regressores externos, recolher os seus regressores em uma matriz X, o que você alimentar o xregparâmetro auto.arima(). (Obviamente, Xdeve ter o mesmo número de linhas que a série temporal que yvocê está modelando.)

Para a previsão, você vai precisar dos futuros valores de suas variáveis explicativas, que você, em seguida, novamente alimentam o xregparâmetro forecast.

As páginas de ajuda são ?auto.arimae ?forecast.Arima(observe a letra A maiúscula - este não é um erro de digitação. Não me pergunte ...).

Stephan Kolassa
fonte
1
(+1) Você pode elaborar um pouco a idéia de causalidade e como testá-la. Pode ser útil para a conclusão de sua resposta, pois você menciona que a decisão de usar o ARIMA é determinada pela direção da causalidade entre as variáveis. Você está, por exemplo, pensando no teste de causalidade de Granger ou no teste de Hausman ? Obrigado.
Javlacalle
3
@ javlacalle: Eu não sou um grande fã de testes estatísticos de causalidade (dos quais o teste de Granger é o mais conhecido). Prefiro decidir sobre "provável causalidade" com base no assunto. Por exemplo, eu não usaria o teste Granger para avaliar se uma redução de preço aumenta as vendas de supermercados ou o contrário. Nem se o PIB, as taxas de câmbio e a criação de empregos são mutuamente causais. Nos dois casos, o assunto parece bastante óbvio, e um teste alinhado com a teoria não nos ensina nada, enquanto um teste que contradiz a teoria será apenas confuso (e provavelmente não mais que ruído).
precisa saber é o seguinte
1
... Eu sei que estou me abrindo para as chamas com o meu último comentário ;-)
Stephan Kolassa
@ Stephan: Obrigado pela sua contribuição. Embora meu y seja definitivamente causado por meus regressores e não o contrário, mas meus regressores se correlacionam definitivamente entre si e também devem ter impactos mais ou menos diretos um sobre o outro. De acordo com o seu comentário, isso significa que eu deveria usar VAR em vez de arima, pois isso evitará problemas (?). Estou usando um pacote de preços de commodities / produtos aqui, que basicamente são todos relacionados até um certo ponto. A "matéria-prima" é o meu Y. Os produtos da cadeia de valor, bem como os produtos secundários etc. são meus preditores.
George
1
Conhecer o contexto dos dados é sempre útil e os resultados de qualquer análise devem ser comparados com nosso conhecimento a priori . No entanto, é aconselhável cautela. A intuição às vezes falha e as teorias que às vezes são tidas como certas baseiam-se em suposições que não são sustentadas por fatos. Mas entendo o que você quer dizer e concordo em geral.
Javlacalle