Eu sou muito novo em R. Estou aprendendo aprendizado de máquina agora. Sinto muito, se esta pergunta parece ser muito básica. Estou tentando encontrar um bom pacote de seleção de recursos na R. Passei pelo pacote Boruta. É um bom pacote, mas li que é útil apenas para classificação.
Eu quero implementar a seleção de recursos em R para tarefas de regressão. Examinei a documentação do pacote de intercalação, mas para o meu nível, é muito difícil de entender.
Alguém pode me indicar um bom tutorial ou listar quaisquer bons pacotes ou pacotes usados com mais freqüência no R para a seleção de recursos.
Qualquer ajuda seria apreciada. Desde já, obrigado.
r
feature-selection
user1787687
fonte
fonte
Respostas:
Você também pode dar uma olhada no FSelector , varSelRF . O FSelector contém várias funções para seleção de recursos com base, por exemplo, no teste do qui-quadrado, na teoria da informação (entropia, informações mútuas, taxa de ganho, ...), na correlação entre recurso, consistência, etc. varSelRF é um pacote útil para seleção de recursos usando florestas aleatórias com eliminação de variáveis anteriores e com espectro de importância.
fonte
Você já viu a Tarefa CRAN de Aprendizado de Máquina e Aprendizado Estatístico, ao lado de Caret e Boruta são mencionados outros pacotes?
Em geral, se você não entende um procedimento estatístico específico em relação à seleção de recursos, pode ser melhor fazer uma pergunta direcionada sobre ele. O seguinte link CV pode parecer bastante útil como um começo: Algoritmos para seleção automática de modelo .
fonte
Sugiro Rattle, que possui seleção aleatória de recursos da floresta (e muito mais). Possui interface gráfica agradável e muito fácil de usar.
fonte
O GLMNET com regressão de laço apresenta seleção.
fonte
Além disso, o
Caret
pacote também fornece métodos de seleção de recursos. Aqui e aqui estão alguns tutoriais sobre como usar a seleção de recursos noCaret package
. Recentemente, um pacote de seleção de recursos baseado no algoritmo SISAL de Tikka e Hollmén está disponível no CRAN .fonte