Depois de ler uma das "Dicas de pesquisa" do RJ Hyndman sobre validação cruzada e séries temporais, voltei a uma antiga pergunta minha que tentarei formular aqui. A idéia é que, em problemas de classificação ou regressão, a ordem dos dados não é importante e, portanto , a validação cruzada k- fold pode ser usada. Por outro lado, em séries temporais, a ordenação dos dados é obviamente de grande importância.
No entanto, quando se utiliza uma máquina modelo para séries temporais de previsão aprendizagem, uma estratégia comum é para reformular a série em um conjunto de "vectores de entrada-saída", que, para um tempo t , têm a forma ( y t - N + 1 , . . . , Y t - 1 , y t ; y t + 1 ) .
Agora, uma vez que essa remodelagem tenha sido feita, podemos considerar que o conjunto resultante de "vetores de entrada e saída" não precisa ser ordenado? Se usarmos, por exemplo, uma rede neural de feed-forward com n entradas para "aprender" esses dados, chegaremos aos mesmos resultados, independentemente da ordem em que mostramos os vetores para o modelo. E, portanto, poderíamos usar a validação cruzada com dobras k da maneira padrão, sem a necessidade de reajustar o modelo a cada vez?