Não sei se essa é uma prática comum / melhor, mas é outro ponto de vista do assunto.
Se você tem, digamos, uma data, pode tratar cada campo como uma "variável de categoria" em vez de uma "variável contínua". O dia teria um valor no conjunto {1, 2 ..., 31}, o mês teria um valor em {1, ..., 12} e, para o ano, você escolheria um valor mínimo e um valor máximo e construa um conjunto.
Então, como os valores numéricos específicos de dias, meses e anos podem não ser úteis para encontrar tendências nos dados, use uma representação binária para codificar os valores numéricos, sendo cada bit um recurso. Por exemplo, o mês 5 seria 0 0 0 0 1 0 0 0 0 0 0 0
(11 0 e a 1 na 5ª posição, cada bit sendo um recurso).
Assim, tendo, por exemplo, 10 anos no "conjunto do ano", uma data seria transformada em um vetor de 43 elementos (= 31 + 12 + 10). Usando "vetores esparsos", a quantidade de recursos não deve ser um problema.
Algo semelhante poderia ser feito para dados de horas, dia da semana, dia do mês ...
Tudo depende da pergunta que você deseja que seu modelo de aprendizado de máquina responda.
Contexto da minha resposta : Houve ótimas respostas até agora. Porém, quero estender a conversa supondo que você esteja falando sobre um aplicativo de aprendizado de máquina para prever valores futuros dessa série temporal específica. Com esse contexto em mente, meu conselho está abaixo.
Conselho : Examine primeiro as estratégias tradicionais de previsão estatística (por exemplo, suavização exponencial, SARIMAX ou regressão dinâmica) como uma linha de base para o desempenho da previsão. Embora o aprendizado de máquina tenha mostrado grande promessa para uma variedade de aplicações, para séries temporais, existem métodos estatísticos experimentados e verdadeiros que podem atendê-lo melhor para sua aplicação. Gostaria de chamar sua atenção para dois artigos recentes:
Se você está procurando um bom desempenho, escolha uma métrica para comparar com vários modelos (como o MASE) e varra vários modelos estatísticos (referências abaixo) e de aprendizado de máquina (com estratégias de desenvolvimento de recursos mencionadas acima).
Felicidades,
Recursos para aprender previsão estatística : Eu começaria revisando o livro de Rob J Hyndman aqui: https://otexts.org/fpp2/ . O texto é baseado em um pacote R que você pode incorporar facilmente em sua análise: https://otexts.org/fpp2/appendix-using-r.html . Por fim, esteja ciente da diferença entre a validação cruzada transversal e a validação cruzada de séries temporais, conforme explicado aqui: https://robjhyndman.com/hyndsight/tscv/ .
fonte