Entendo teoricamente (mais ou menos) como eles funcionariam, mas não tenho certeza de como usar um método de conjunto (como votação, misturas ponderadas etc.).
- Quais são os bons recursos para implementar métodos de ensemble?
- Existem recursos específicos em relação à implementação em Python?
EDITAR:
Para esclarecer alguns com base na discussão dos comentários, não estou procurando algoritmos de conjuntos, como randomForest, etc. Em vez disso, estou me perguntando como você pode combinar classificações diferentes de algoritmos diferentes.
Por exemplo, digamos que alguém use regressão logística, SVM e alguns outros métodos para prever a classe de uma determinada observação. Qual é a melhor maneira de capturar a melhor estimativa da classe com base nessas previsões?
fonte
'Métodos de conjunto em mineração de dados: aprimorando a precisão através da combinação de previsões', Seni e Elder - Excelente referência sobre teoria e implementação de conjuntos práticos, mas o código que o acompanha é baseado em R.
'Aprendizado de máquina: uma perspectiva algorítmica', S. Marsland - Excelente texto prático baseado em Python, mas não tão dedicado a conceitos de conjuntos puros quanto a primeira referência.
fonte
A resposta atarracada de Joe Pete foi perfeita, mas como você mencionou uma implementação em Python, eu queria mencionar o projeto de fabricação de cerveja da Universidade Federal de Pernambuco.
https://github.com/viisar/brew
Neste ponto, eles têm geração de conjuntos, combinação, poda e seleção dinâmica.
Limitações: somente classificação; sem empilhamento na versão pública atual; não há muita documentação.
fonte
A Salford Systems possui um pacote de software chamado Random Forests que implementa isso para conjuntos de árvores de classificação e regressão. Não tenho pacotes R gratuitos para oferecer. Eu imagino que eles tenham um manual do usuário que explique sua implementação. Por analogia, você provavelmente poderia descobrir como fazer isso para outros métodos de conjunto.
fonte
Encontrei este tutorial que foi extremamente útil. Ele não responde a todas as partes, mas acho que é um ótimo começo para a discussão: http://vikparuchuri.com/blog/intro-to-ensemble-learning-in-r/
fonte
Scikit-learn ensembling guia fornece ensacamento e impulsionar meta-classificadores e regressores. Além do que, além do mais, biblioteca mlxtend fornece implementações de meta-classificadores e regressores de empilhamento .
fonte