Como é sabido a todos, a engenharia de recursos é extremamente importante para o aprendizado de máquina, no entanto, encontrei poucos materiais associados a essa área. Participei de várias competições no Kaggle e acredito que bons recursos podem até ser mais importantes do que um bom classificador em alguns casos. Alguém conhece algum tutorial sobre engenharia de recursos ou é uma experiência pura?
19
Respostas:
Eu diria experiência - as idéias básicas são:
fonte
Existe um livro de O'Reilly chamado " Feature Engineering for Machine Learning " de Zheng et al.
Eu li o livro e ele cobre diferentes tipos de dados (por exemplo, categóricos, texto ...) e descreve diferentes aspectos da engenharia de recursos que o acompanham. Isso inclui coisas como normalização de dados, seleção de recursos e tf-idf no texto.
fonte