Qual é a melhor maneira de dividir dados de séries temporais em conjuntos de trem / teste / validação, onde o conjunto de validação seria usado para o ajuste de hiperparâmetros?
Temos três anos de dados de vendas diárias e nosso plano é usar 2015-2016 como dados de treinamento e, em seguida, amostrar aleatoriamente 10 semanas a partir dos dados de 2017 para serem usados como conjunto de validação e outras 10 semanas a partir de 2017 para o conjunto de teste. Em seguida, avançaremos em cada um dos dias no conjunto de teste e validação.
fonte