Atualmente, estou trabalhando em um projeto para fazer a previsão de dados de séries temporais (dados mensais). Estou usando R para fazer a previsão. Eu tenho 1 variável dependente (y) e 3 variáveis independentes (x1, x2, x3). A variável y tem 73 observações e as outras 3 variáveis (também 73). De janeiro de 2009 a janeiro de 2015. Verifiquei correlações e valor-p, e é tudo significativo colocá-lo em um modelo. Minha pergunta é: como posso fazer uma boa previsão usando todas as variáveis independentes? Não tenho valores futuros para essas variáveis. Digamos que eu gostaria de prever qual minha variável y em mais de 2 anos (em 2017). Como posso fazer isso?
Eu tentei o seguinte código:
model = arima(y, order(0,2,0), xreg = externaldata)
Posso fazer uma previsão do valor de y em mais de 2 anos com este código?
Eu também tentei um código de regressão:
reg = lm(y ~ x1 + x2 + x3)
Mas como eu dedico um tempo neste código? Como posso prever qual será meu valor y, digamos 2 anos? Eu sou novo em estatísticas e previsões. Fiz algumas leituras e excedi o valor de atraso, mas como posso usar um valor de atraso no modelo para fazer previsões?
Na verdade, minha pergunta geral é como posso prever dados de séries temporais com variáveis externas sem valor futuro?
Respostas:
Se você ajustar um modelo usando variáveis externas e desejar prever a partir desse modelo, precisará de valores futuros (previstos) das variáveis externas, simples e simples. Não há como contornar isso.
É claro que existem maneiras diferentes de prever suas variáveis explicativas. Você pode usar o último valor observado (a previsão de "passeio aleatório ingênuo") ou a média geral. Você pode simplesmente defini-los como zero se esse for um valor útil para eles (por exemplo, eventos especiais que aconteceram no passado como um terremoto, que você não espera que ocorram). Ou você pode ajustar e prever um modelo de série temporal para essas variáveis explicativas, por exemplo, usando
auto.arima
.A alternativa é ajustar um modelo aos seus valores sem variáveis explicativas, removendo o parâmetro e, em seguida, prever usando esse modelo. Uma vantagem é que isso pode até capturar regularidades em suas variáveis explicativas. Por exemplo, suas vendas de sorvetes podem ser impulsionadas pela temperatura e você não tem boas previsões de temperatura daqui a alguns meses ... mas a temperatura é sazonal, portanto, simplesmente o ajuste de um modelo sem temperatura gera um modelo sazonal e sua sazonalidade as previsões podem realmente ser muito boas, mesmo se você não incluir o driver real das vendas.yy y
xreg
Eu recomendo este livro de previsão on-line gratuito , especialmente esta seção sobre regressão múltipla (infelizmente, não há nada sobre o ARIMAX), bem como a postagem no blog de Rob Hyndman "O modelo ARIMAX" .
fonte
Como Yogi Berra disse: "É difícil fazer previsões, especialmente sobre o futuro".
Muitos módulos de software estatístico geram previsões com base no fluxo univariado de séries temporais na ausência de informações futuras, por exemplo, Previsão de Proc no SAS ou qualquer número de módulos ARIMA disponíveis. Essas previsões são projeções baseadas no comportamento histórico dos seus dados.
Você nos diz que seus dados são mensais, mas não nos diz quantos períodos você tem disponível. Outra abordagem é atrasar seus três IVs em 24 meses em relação ao DV, para que o período que eles estão prevendo seja t + 24. Isso pressupõe que você tenha uma data suficiente para inicializar o modelo e calibrar qualquer sazonalidade relevante, conforme apropriado.
fonte
A meu ver, você tem três opções:
Cada abordagem tem seus próprios pontos fortes e fracos, portanto, o melhor depende do contexto específico.
fonte