Previsão de séries temporais não estacionárias

8

Gostaria de prever as séries temporais não estacionárias, envolvendo várias suposições a priori cruciais após o estudo de instâncias de tais séries.

  1. Eu construí a função de distribuição de probabilidade de um ponto com média de tempo aproximada pela distribuição normal. Desse ponto de vista, desejo que a previsão não exceda isso quando . Em outras palavras, a variação de deve ser limitada.zt(l)lzt(l)

    p^(x)=12πσ2exp(-x22σ2)
    zt(eu)euzt(eu)
  2. A função de distribuição de probabilidade de dois pontos média também foi construída, o que levou à identificação da função de autocorrelação. forneceu .ρ(j)Umj-α0<α<0,5p^(xEu,Eu;xj,j)ρ(j)UMAj-α0 0<α<0,5

No começo, o processo de identificação Box-Jenkins me levou ao modelo , no entantoUMAREuMUMA(0 0,1,3)

  1. Não posso ter variação limitada até (que segue das equações para pesos BJ ). Ao mesmo tempo, não posso usar pois a autocorrelação inicial diminui lentamente (o que provavelmente é evidência de não estacionariedade de acordo com BJ). Este é o principal obstáculo para mim.ψ j d = 0d0 0ψjd=0 0

  2. Visualmente, a simulação do não coincide com o comportamento das minhas amostras. E correlações da primeira diferença da série estão em péssima concordância com as correlações que seguem o modelo.UMAREuMUMA(0 0,1,3)

  3. A análise dos resíduos mostra correlações significativas a partir do atraso 3. É por isso que minha afirmação inicial sobre o está incorreta.UMAREuMUMA(0 0,1,3)

Tentando ajustar diferentes , vejo que há correlações residuais significativas próximas ao lag para cada . Pode-se supor que eu precise do modelo (como opção limitadora), por exemplo, ARIMA fracionário.p p A R I M A ( , 0 , q )UMAREuMUMA(p,0 0,0 0)ppUMAREuMUMA(,0 0,q)

De [1] eu aprendi sobre os fracionários que são em vigor.A R I M A ( , 0 , q )UMAREuMUMA(p,d,q)UMAREuMUMA(,0 0,q)

  1. Não encontrei nenhum pacote GNU R com suporte a valores ausentes para isso. A falta de valores parece ser um tipo de desafio.

  2. As publicações sobre o ARIMA fracionário são bastante raras. Esses modelos fracionários são realmente usados? Talvez haja uma boa substituição dos modelos ARIMA para as minhas necessidades? A previsão não é minha especialidade, tenho apenas interesse pragmático.

  3. De literatura diferente (por exemplo [2]), aprendi que é praticamente impossível decidir entre ARIMA fracionário e modelos com "mudança de nível". No entanto, não encontrei o pacote para o GNU R se encaixar nos modelos de 'mudança de nível'.

[1]: Granger, Joyeux .: J. da série temporal anal. vol. 1 não. 1 1980, p.15

[2]: Grassi, de Magistris .: "Quando a memória longa encontra o filtro de Kalman: um estudo comparativo", Estatística Computacional e Análise de Dados, 2012, no prelo.

Atualização: para renderizar meu próprio progresso e responder @IrishStat

Minha afirmação sobre a distribuição de probabilidade de dois pontos é incorreta em geral. A função construída dessa maneira dependerá do comprimento total da série. Portanto, há um pouco a extrair disso. Pelo menos, o parâmetro chamado dependerá do comprimento completo da série.α

As listas 2 e 3 também foram atualizadas.

Meus dados estão disponíveis como arquivo dat aqui .

No momento atual, duvido entre a FARIMA e as mudanças de nível, e ainda não consigo encontrar o software apropriado para verificar essas opções. Essa também é minha primeira experiência com a identificação de modelos, portanto qualquer ajuda será apreciada.

0x2207
fonte
Estou um pouco confuso com seus dados. Por exemplo, qual é o significado de 6325.76 ... e -.247831. O que está sendo observado? Os dados são cronológicos e igualmente espaçados no tempo? 6.325,76666666667 -,247831949032426 "770" 6.326,78333333333 ,0282060159445925 "771" 6.327,78333333333 ,162348034962085 "772" 6.328,78333333333 -,206057978534193 "773" 6.329,78333333333 -,427928912063427 "774" 6.330,78333333333 NA "775" 6331,78333333333 NA "776" 6332,78333333333 NA "777" 6333,78333333333 NA "778" 6334,78333333333 NA
IrishStat
Este é o resultado write.table (). A primeira coluna é "nome da linha" (sem sentido), a segunda é o momento, o terceiro valor. São observações quase igualmente espaçadas, muitos dados são perdidos.
0x2207
As abordagens no domínio do tempo exigem dados igualmente espaçados, sem valores ausentes. Para fins pedagógicos, pegarei um subconjunto dos dados E assumirei que eles estão igualmente espaçados e tentarei caracterizá-los.
precisa saber é o seguinte

Respostas:

5

Eu nunca vi um modelo como o processo de identificação Box-Jenkins me levar ao modelo ARIMA (0,1,3), mas eu nunca tinha visto um cisne negro até eu ir para a Austrália. Publique seus dados, pois isso pode sugerir a necessidade de

  1. Detecção de intervenção levando a incluir mudanças de nível, tendências da hora local e outros
  2. Parâmetros variáveis ​​no tempo
  3. Variação de erro variável no tempo

Se seus dados são confidenciais, basta escalá-los.

OK, tendo recebido seus dados (cerca de 80000 leituras), selecionei 805 observações a partir do ponto 6287 e obtive.

insira a descrição da imagem aqui. Um ponto de mudança significativo foi detectado no período 137, sugerindo parâmetros variáveis ​​no tempo. As 668 observações restantes sugerem um modelo ARIMA pdq (3,0,0) com uma mudança de level.step que suporta suas conclusões preliminares sobre o lag 3 insira a descrição da imagem aqui.. O gráfico Real / Ajustado / Previsão é insira a descrição da imagem aquiO Gráfico Residual insira a descrição da imagem aquie a acf dos resíduos é insira a descrição da imagem aqui. Como a ACF dos resíduos mostra uma estrutura forte nos períodos 5 e 10, insira a descrição da imagem aquivocê pode investigar melhor a estrutura sazonal no lag 5. Espero que isso ajude.

IrishStat
fonte