Os métodos de aprendizado múltiplo do kernel visam construir um modelo de kernel em que o kernel é uma combinação linear de kernels de base fixa. O aprendizado do kernel consiste em aprender os coeficientes de ponderação de cada kernel base, em vez de otimizar os parâmetros do kernel de um único kernel.
As desvantagens do aprendizado de vários kernel parecem ser menos interpretáveis e caras em termos computacionais (para avaliar a saída do modelo, é necessário avaliar todos os kernels base). Portanto, se um desempenho semelhante puder ser alcançado simplesmente otimizando um único kernel, quais são as vantagens do MKL?
machine-learning
svm
kernel-trick
Dikran Marsupial
fonte
fonte
Respostas:
Há duas vantagens (ou melhor, dois casos de uso):
Para todas as aplicações de SVMs, um usuário precisa escolher qual kernel usar e, às vezes, até criar suas próprias matrizes de kernel. É possível aliviar a escolha de kernels ou designs especializados de kernel? MKL foi um passo em direção a isso.
O segundo caso IMHO é de longe um caso mais convincente. Considere que sua entrada de dados é um dado de vídeo + cc. A representação de recursos de cada vídeo consiste em recursos de vídeo, recursos de áudio e recursos de texto. Esses dados são conhecidos como dados multimodais. Cada conjunto desses recursos pode exigir uma noção diferente de similaridade (um kernel diferente). Em vez de criar um kernel especializado para tais aplicativos, é possível apenas definir o kernel para cada um desses modos e combiná-los linearmente?
fonte