Suponho que você queira dizer seleção de recursos como engenharia de recursos . O processo que eu costumo seguir e vejo algumas pessoas fazendo é
- Engenharia de recursos
Tente alguns algoritmos, geralmente os de alto desempenho, como RandomForest, Gradient Boosted Trees, Neutral Networks ou SVM nos recursos.
2.1 Faça o ajuste simples de parâmetros, como pesquisa em grade, em um pequeno intervalo de parâmetros
Se o resultado da etapa 2 não for satisfatório, volte à etapa 1 para gerar mais recursos ou remova recursos redundantes e mantenha os melhores, as pessoas geralmente chamam essa seleção de recurso . Se ficar sem ideias para novos recursos, tente mais algoritmos.
Se o resultado estiver bom ou próximo do desejado, vá para a etapa 3
- Amplo ajuste de parâmetros
A razão para fazer isso é que a classificação tem tudo a ver com engenharia de recursos e, a menos que você conheça um classificador poderoso e incrível, como aprendizado profundo personalizado para um problema específico, como o Computer Vision. Gerar bons recursos é a chave. A escolha de um classificador é importante, mas não crucial. Todos os classificadores mencionados acima são bastante comparáveis em termos de desempenho e, na maioria das vezes, o melhor classificador acaba sendo um deles.
O ajuste de parâmetros pode aumentar bastante o desempenho, em alguns casos. Mas sem boas características, o ajuste não ajuda muito. Lembre-se de que você sempre tem tempo para ajustar os parâmetros. Além disso, não há motivo para ajustar os parâmetros extensivamente, então você descobre um novo recurso e refaz tudo.