Apenas uma pergunta geral. Se você possui dados de séries temporais, quando é melhor usar técnicas de séries temporais (aka, ARCH, GARCH, etc) sobre técnicas de aprendizado de máquina / estatística (KNN, regressão)? Se houver uma pergunta semelhante sobre validação cruzada, aponte-me para ela - olhou e não conseguiu encontrar uma.
10
Respostas:
Os métodos típicos de aprendizado de máquina pressupõem que seus dados são independentes e distribuídos de forma idêntica, o que não é verdade para os dados de séries temporais. Portanto, eles estão em desvantagem em comparação com as técnicas de séries temporais, em termos de precisão. Para obter exemplos disso, consulte as perguntas anteriores. A ordenação de séries temporais para aprendizado de máquina e a floresta aleatória está sobregravada .
fonte
Francis Diebold publicou recentemente "ML e Metrics VI: uma diferença fundamental entre ML e TS Econometrics" em seu blog. Estou fornecendo uma versão reduzida, para que todo o crédito seja para ele. (A ênfase em negrito é minha.)
Assim, a conclusão é:
Eu recomendo a leitura de todo o post original aqui .
fonte
Como o @Tom Minka apontou, a maioria das técnicas de ML assume entradas do iid. Existem algumas soluções, porém:
Pode-se usar todas as amostras de séries temporais passadas dentro do sistema 'Memória' como um vetor de característica, ou seja: x = [x (t-1), x (t-2), ... x (tM)]. No entanto, isso tem dois problemas: 1) dependendo do seu binning, você pode ter um vetor de recurso enorme 2- alguns métodos exigem que os recursos do vetor de recurso sejam independentes, o que não é o caso aqui.
Existem muitas técnicas de ML que são projetadas especificamente para esses dados de séries temporais, por exemplo, Hidden Markov Models, que foram usadas com muito sucesso para detecção de ataques, processamento de fala, etc.
Finalmente, uma abordagem adotada é usar técnicas de 'extração de recursos' para converter um problema de regressão dinâmica (que tem o elemento de tempo) em um estático. Por exemplo, a abordagem do Modo Dinâmico Principal (PDM) mapeia o vetor de recurso passado da entrada ([x (t-1), x (t-2), ... x (tM)])) para um estático ([v ( 1), v (2), .. v (L)]) convolvendo o passado com um banco de filtros linear específico do sistema (os PDMs), consulte Marmarelis, livro de 2004 ou Marmarelis, Vasilis Z. "Metodologia de modelagem para sistemas fisiológicos não lineares . " Anais de engenharia biomédica 25.2 (1997): 239-251 ...
fonte