Existem aplicativos em que o SVM ainda é superior?

10

O algoritmo SVM é bastante antigo - foi desenvolvido nos anos 1960, mas era extremamente popular nos anos 1990 e 2000. É uma parte clássica (e bastante bonita) dos cursos de aprendizado de máquina.

Hoje, parece que no processamento de mídia (imagens, som etc.) as redes neurais dominam completamente, enquanto em outras áreas o Gradient Boosting tem posições muito fortes.

Além disso, nas recentes competições de dados, não observo soluções baseadas em SVM.

Estou procurando exemplos de aplicativos nos quais o SVM ainda fornece resultados de última geração (a partir de 2016).

Atualização: eu gostaria de ter um exemplo que eu possa dar, por exemplo, a alunos / colegas ao explicar o SVM, para que não pareça uma abordagem puramente teórica ou obsoleta.

Alleo
fonte
3
Superior em que sentido? Alguma métrica de desempenho? Treinar uma rede neural profunda exige uma quantidade substancial de tempo no computador, mas posso treinar um SVM que possa ser reparado no meu laptop.
Sycorax diz Restabelecer Monica
@ user777 Refiro-me à métrica de classificação / regressão apropriada para o campo de aplicação, é claro. O problema com complexidade computacional para DL é importante, mas isso está um pouco fora do escopo desta questão.
Alleo

Respostas:

11

De acordo com o artigo , precisamos de centenas de classificadores para resolver problemas de classificação no mundo real? O SVM, juntamente com as máquinas de inicialização aleatória de floresta e gradiente, está entre os algoritmos de classificação com melhor desempenho para um grande conjunto de mais de 120 conjuntos de dados (usando a precisão como métrica).

Repeti seus experimentos com algumas modificações e obtive esses três classificadores com desempenho melhor que os outros, mas como o teorema do almoço grátis diz que sempre há um problema em que algum outro algoritmo tem desempenho melhor que esses três.

Então, sim, eu diria que o SVM (com kernel Gaussiano - foi o que eu usei) ainda é um algoritmo relevante para conjuntos de dados não relacionados à mídia.

Jacques Wainer
fonte
Oi, obrigado pela resposta! Eu já vi esse estudo interessante. Pelo que entendi, a ideia era ver quanto o classificador fornece sem nenhum ajuste sério (enquanto o analista de dados deve executar o ajuste do IMO). Um estudo relacionado à área seria de maior interesse.
Alleo
11
Lembro-me de que Delgado e todos não fizeram uma pesquisa muito detalhada dos melhores hiperparâmetros, mas se realizaram alguma pesquisa. A questão (para a qual não tenho resposta) é se uma pesquisa mais minuciosa dos melhores parâmetros de hype resultaria em resultados diferentes. Se isso for verdade, significaria que os algoritmos concorrentes ao SVM têm, em geral, um pico muito acentuado na precisão de determinados hiperparâmetros, o que eu acho que é um fator negativo para o algoritmo.
Jacques Wainer
Também um pequeno comentário é que os conjuntos de dados UCI (usados ​​para testes) são geralmente muito pequenos. Gostaria de saber se isso poderia ser a explicação para maus resultados de impulsionar? A maioria dos desafios do kaggle (com muitos dados) demonstra o desempenho superior do GB.
Alleo
Concordo que os conjuntos de dados são pequenos. Para conjuntos de dados maiores, eu uso o Random Forests no momento - começarei a usar o GBM assim que me sentir mais confortável com os hiperparâmetros - não sei o quão sensato é o GBM para eles.
Jacques Wainer