Como um classificador de conjunto mescla as previsões de seus classificadores constituintes? Estou tendo dificuldade em encontrar uma descrição clara. Em alguns exemplos de código que encontrei, o conjunto apenas calcula a média das previsões, mas não vejo como isso poderia fazer uma precisão geral "melhor".
Considere o seguinte caso. Um classificador de conjunto é composto por 10 classificadores. Um classificador possui uma precisão de 100% do tempo no subconjunto de dados X e 0% em todos os outros momentos. Todos os outros classificadores têm uma precisão de 0% no subconjunto de dados X e 100% em todos os outros momentos.
Usando uma fórmula de média, em que a precisão do classificador é ignorada, o classificador de conjunto teria, na melhor das hipóteses, 50% de precisão. Isso está correto ou estou faltando alguma coisa? Como a previsão média de N classificadores potencialmente sem noção pode criar uma previsão melhor que um único classificador especialista em um domínio específico?
Está faltando o fato de que o classificador "ruim" não possui precisão de 0%, mas não é significativamente melhor do que uma estimativa aleatória.
Dessa maneira, as boas previsões são sempre as mesmas e se acumulam (já que a verdade é apenas uma), enquanto as previsões ruins são ruídos aleatórios que são calculados em média.
fonte
No caso de classificação, geralmente existem duas maneiras de agrupar a previsão. Vamos dizer que é um problema de classificação de classe binária e você tem 3 modelos para agrupar chamados m1, m2 e m3 e o conjunto de dados de treinamento é chamado de trem e conjunto de dados de teste chamado test.Modelos já são construídos no train.Then um código python será o seguinte.
O primeiro método é fazer uma ronda da média
Portanto, a saída será um vetor de valor 0 e 1
O segundo método é agrupar a probabilidade de previsão de cada classe a partir desses modelos e agrupá-las e, em seguida, decidir a classe com base em um limite rígido ou em alguma lógica.
itere através de todo o vetor pred_proba para descobrir qual em 0 e qual é 1 sendo 1 com base no limite rígido 0,5
Então pred é a previsão do conjunto final.
fonte