Eu sei que não há uma resposta clara para essa pergunta, mas vamos supor que eu tenha uma enorme rede neural, com muitos dados e que eu queira adicionar um novo recurso na entrada. A "melhor" maneira seria testar a rede com o novo recurso e ver os resultados, mas existe um método para testar se o recurso É ÚLTIMO PROVÁVEL? Como medidas de correlação ( http://www3.nd.edu/~mclark19/learn/CorrelationComparison.pdf ) etc?
16
Respostas:
Uma correlação muito forte entre o novo recurso e um recurso existente é um sinal bastante bom de que o novo recurso fornece pouca informação nova. Uma baixa correlação entre o novo recurso e os recursos existentes é provavelmente preferível.
Uma forte correlação linear entre o novo recurso e a variável prevista é um bom sinal de que um novo recurso será valioso, mas a ausência de uma alta correlação não é necessária, um sinal de um recurso ruim, porque as redes neurais não estão restritas a combinações lineares de variáveis.
Se o novo recurso foi construído manualmente a partir de uma combinação de recursos existentes, considere deixá-lo de fora. A beleza das redes neurais é que pouca engenharia e pré-processamento de recursos são necessários - os recursos são aprendidos por camadas intermediárias. Sempre que possível, prefira os recursos de aprendizado a projetá-los.
fonte
Se você estiver usando o sklearn, há uma boa função disponível chamada model.feature_importances_. Experimente o seu modelo / novo recurso e veja se isso ajuda. Também veja aqui e aqui exemplos.
fonte