Quais são as características ou propriedades que indicam que um determinado problema de aprendizado pode ser resolvido usando máquinas de vetores de suporte?
Em outras palavras, o que é que, quando você vê um problema de aprendizagem, faz você "oh, eu definitivamente devo usar SVMs para isso '', em vez de redes neurais, árvores de decisão ou qualquer outra coisa?
supervised learning
tag, pois as SVM também podem ser usadas em problemas de aprendizado não supervisionados .exception
, você quer dizer que é apenas uma emenda e não a convenção, certo?Respostas:
O SVM pode ser usado para classificação (distinção entre vários grupos ou classes) e regressão (obtenção de um modelo matemático para prever algo). Eles podem ser aplicados a problemas lineares e não lineares.
Até 2006, eles eram o melhor algoritmo de propósito geral para aprendizado de máquina. Eu estava tentando encontrar um artigo que comparasse muitas implementações dos algoritmos mais conhecidos: svm, redes neurais, árvores, etc. Não consegui sentir muito (você terá que acreditar em mim, coisa ruim). No artigo, o algoritmo que obteve o melhor desempenho foi svm, com a biblioteca libsvm.
Em 2006, Hinton criou um aprendizado profundo e redes neurais. Ele melhorou o estado da arte atual em pelo menos 30%, o que é um grande avanço. No entanto, o aprendizado profundo apenas obtém um bom desempenho para grandes conjuntos de treinamento. Se você tem um pequeno conjunto de treinamento, sugiro usar svm.
Além disso, você encontra aqui um infográfico útil sobre quando usar diferentes algoritmos de aprendizado de máquina pelo scikit-learn. No entanto, até onde sei, não há acordo entre a comunidade científica sobre se um problema possui recursos X, Y e Z, então é melhor usar o svm. Eu sugeriria tentar métodos diferentes. Além disso, não esqueça que svm ou redes neurais são apenas um método para calcular um modelo. É muito importante também os recursos que você usa.
fonte
Vamos supor que estamos em uma configuração de classificação.
Pois a
svm
engenharia de recursos é a pedra angular:svm
desempenho sofre à medida que aumentamos o número de dimensões mais rapidamente do que outras metodologias (conjunto de árvores). Isso ocorre devido ao problema de otimização restrito que apóiasvm
s. Às vezes, a redução de recursos é viável, às vezes não, e é nesse momento que não podemos realmente abrir o caminho para um uso eficaz desvm
svm
provavelmente enfrentará um conjunto de dados em que o número de recursos é muito maior que o número de observações. Isso, novamente, pode ser entendido observando o problema de otimização restrito.svm
algoritmo.fonte