Estou usando o SVM para classificação e estou tentando determinar os parâmetros ideais para os núcleos linear e RBF. Para o kernel linear, utilizo a seleção de parâmetros com validação cruzada para determinar C e, para o kernel RBF, uso a pesquisa em grade para determinar C e gama.
Eu tenho 20 recursos (numéricos) e 70 exemplos de treinamento que devem ser classificados em 7 classes.
Qual intervalo de pesquisa devo usar para determinar os valores ideais para os parâmetros C e gama?
fonte
Confira a seção 2.3.2 deste artigo de Chapelle e Zien. Eles têm uma boa heurística para selecionar um bom intervalo de pesquisa para do kernel RBF e C para o SVM. Eu citoσ C
Em seguida, eles usam múltiplos (por exemplo, para k ∈ { - 2 , . . . , 2 } ) do valor padrão como intervalo de pesquisa em uma grade-pesquisar usando validação cruzada. Isso sempre funcionou muito bem para mim.2k k ∈ { - 2 , . . . , 2 }
É claro que dissemos @ciri, normalizar os dados etc. é sempre uma boa ideia.
fonte