Por que essa previsão de séries temporais é "muito ruim"?

15

Estou tentando aprender a usar redes neurais. Eu estava lendo este tutorial .

Depois de ajustar uma rede neural em uma série temporal usando o valor em para prever o valor em t + 1, o autor obtém o seguinte gráfico, onde a linha azul é a série temporal, o verde é a previsão nos dados do trem, o vermelho é o previsão sobre dados de teste (ele usou uma divisão de teste)tt+1p1

e o chama "Podemos ver que o modelo fez um trabalho muito ruim ao ajustar os conjuntos de dados de treinamento e teste. Basicamente, ele previu o mesmo valor de entrada que a saída".

Então o autor decide usar , t - 1 e t - 2 para prever o valor em t + 1 . Ao fazê-lo, obtémtt-1t-2t+1

p2

e diz "Olhando para o gráfico, podemos ver mais estrutura nas previsões".

Minha pergunta

Por que os primeiros "pobres"? parece quase perfeito para mim, prediz todas as mudanças perfeitamente!

E da mesma forma, por que o segundo é melhor? Onde está a "estrutura"? Para mim, parece muito mais pobre que o primeiro.

Em geral, quando é boa uma previsão de séries temporais e quando é ruim?

Euler_Salter
fonte
3
Como comentário geral, a maioria dos métodos de BC são para análises transversais e precisam de ajustes para serem aplicados em séries temporais. A principal razão é autocorrelação nos dados, enquanto no ML muitas vezes os dados são assumidos independente na maioria dos métodos populares
Aksakal
11
Ele faz um ótimo trabalho de prever todas as alterações ... logo após isso acontecer!
Hbbs #
@ Hobbs, eu não estou tentando usar t, t-1, t-2 etc para prever t + 1. Eu queria saber se você sabe quantos termos no passado é melhor usar. Se usarmos demais, estaremos super adaptados?
Euler_Salter
Teria sido mais esclarecedor traçar os resíduos.
Reo katoa 5/10

Respostas:

23

É uma espécie de ilusão de ótica: o olho olha para o gráfico e vê que os gráficos vermelho e azul estão ao lado de cada um. O problema é que eles estão próximos um do outro horizontalmente , mas o que importa é a verticaldistância. O olho vê mais facilmente a distância entre as curvas no espaço bidimensional do gráfico cartesiano, mas o que importa é a distância unidimensional dentro de um valor t particular. Por exemplo, suponha que tivéssemos os pontos A1 = (10.100), A2 = (10.1, 90), A3 = (9.8,85), P1 = (10.1.100.1) e P2 = (9.8, 88). Naturalmente, o olho compara P1 a A1, porque esse é o ponto mais próximo, enquanto P2 será comparado a A2. Como P1 está mais próximo de A1 que P2 está em A3, P1 parecerá uma previsão melhor. Mas quando você compara P1 a A1, você está apenas vendo como A1 pode repetir o que viu anteriormente; em relação a A1, P1 não é uma previsão. A comparação adequada é entre P1 vs. A2 e P2 vs. A3, e nesta comparação P2 é melhor que P1. Teria sido mais claro se, além de plotar y_actual e y_pred contra t, houvesse gráficos de (y_pred-y_actual) contra t.

Acumulação
fonte
2
Essa é a melhor resposta, pois a outra nem sequer menciona por que uma previsão "boa aparência" é realmente ruim, enquanto você faz um ótimo trabalho!
Richard Hardy
17

Por que os primeiros "pobres"? parece quase perfeito para mim, prediz todas as mudanças perfeitamente!

É uma previsão chamada "deslocada". Se você olhar mais de perto o gráfico 1, verá que o poder de previsão é apenas copiar quase exatamente o último valor visto. Isso significa que o modelo aprendeu nada melhor e trata a série temporal como uma caminhada aleatória. Eu acho que o problema pode estar no fato de você usar os dados brutos que você alimenta na rede neural. Esses dados não são estacionários, causando todos os problemas.

Alexey Burnakov
fonte
8
Na previsão, isso é chamado de previsão "ingênua", ou seja, use a última observação como previsão
Aksakal
Obrigado! @Aksakal, você sabe quantos valores anteriores devem ser usados ​​para previsão?
Euler_Salter
Concentre-se na estacionariedade. Um par de defasagens estacionárias deve ser bastante bom para esta série cronológica. Melhor que 100 defasagens não estacionárias.
Alexey Burnakov
em séries temporais há uma maneira de obter um bom palpite sobre a estrutura lag através ACF e PACF, pesquisa deste fórum, havia muitos posts sobre como é feito
Aksakal
@AlexeyBurnakov, então isso significa que devo transformá-lo em estacionário?
Euler_Salter 5/10