Estou lendo o aprendizado prático de máquina com o Scikit-Learn e o TensorFlow: conceitos, ferramentas e técnicas para criar sistemas inteligentes . Então, não sou capaz de descobrir a diferença entre votação forçada e votação suave no contexto de métodos baseados em conjuntos.
Cito descrições deles no livro. As duas primeiras imagens da parte superior são uma descrição para votação forçada, e a última é para votação forçada.
Na minha opinião, o voto duro é a decisão da maioria, mas não entendo o voto branda e a razão pela qual o voto brando é melhor do que o voto duro. Alguém me ensinaria isso?
machine-learning
ensemble
gogogogogo
fonte
fonte
Respostas:
Vamos dar um exemplo simples para ilustrar como as duas abordagens funcionam.
Imagine que você tem 3 classificadores (1, 2, 3) e duas classes (A, B), e após o treinamento você está prevendo a classe de um único ponto.
Votação difícil
Previsões :
Os classificadores 2/3 preveem a classe B, então a classe B é a decisão do conjunto .
Votação suave
Previsões
(Isso é idêntico ao exemplo anterior, mas agora expresso em termos de probabilidades. Valores mostrados apenas para a classe A aqui porque o problema é binário):
A probabilidade média de pertencer à classe A entre os classificadores é
(99 + 49 + 49) / 3 = 65.67%
. Portanto, a classe A é a decisão do conjunto .Assim, você pode ver que, no mesmo caso, a votação branda e dura pode levar a decisões diferentes. A votação branda pode melhorar a votação branda porque leva em conta mais informações; usa a incerteza de cada classificador na decisão final. A alta incerteza nos classificadores 2 e 3 aqui significou essencialmente que a decisão final do conjunto dependia fortemente do classificador 1.
Este é um exemplo extremo, mas não é incomum que essa incerteza altere a decisão final.
fonte