Técnicas para aprendizado on-line incremental do classificador em dados de fluxo

9

Quais podem ser boas técnicas para enfrentar esse problema abstrato?

Você tem um fluxo de dados de um sinal contínuo, como o de um sensor físico. Esse sinal tem valores reais (discretizados), nenhum atributo; características adicionais (por exemplo, potência, correlação automática, entropia) podem ser extraídas. Você pode atribuir uma etiqueta de um conjunto finito a uma janela do sinal. Deixe este rótulo ser um rótulo de treinamento . Você deve escolher os pontos inicial e final da janela, bem como o rótulo da janela.

A tarefa é classificar as próximas janelas online, assim como o sinal é recebido.

Estou pedindo um algoritmo incremental, no sentido de que ele deve aumentar seu desempenho de detecção, devido a mais rótulos de treinamento. Mas deve ser capaz de classificar mesmo após apenas um rótulo de treinamento.

Se o problema for muito difícil por causa da detecção dos limites das janelas, digamos que você possa corrigir o tamanho deles em uma pequena constante. Assim, o algoritmo classifica pequenas fatias do sinal e depois funde as adjacentes com os mesmos rótulos. Se você usar essa abordagem simplificada, justifique por que é razoável.

stackovergio
fonte

Respostas:

2

Se esse é um problema de classificação binária, deve ser possível aplicar um SVM on-line, como Bordes, A. e Bottou, L. , "The Huller: um SVM on-line simples e eficiente", ECML 2005 .

Se esta é uma classificação não-binária (ou seja, mais de 2 rótulos possíveis), você pode examinar as técnicas de mínimos quadrados recursivos do kernel. Eles são feitos para regressão online, mas também apresentam um bom desempenho para classificação online. Aqui está um algoritmo básico do KRLS: Y. Engel, S. Mannor e R. Meir , "O Kernel Recusrive Algoritmo de Mínimos Quadrados", IEEE Trans. Processamento de Sinais, 2004 .

Ambas as abordagens exigirão tamanhos de janela fixos para comparar vetores de entrada do mesmo tamanho.

Steven
fonte