Quase todo exemplo de árvore de decisão que encontrei é uma árvore binária. Isso é praticamente universal? A maioria dos algoritmos padrão (C4.5, CART etc.) suporta apenas árvores binárias? Pelo que entendi, CHAID não se limita a árvores binárias, mas isso parece ser uma exceção.
Uma divisão bidirecional seguida por outra divisão bidirecional em uma das crianças não é a mesma coisa que uma divisão única. Isso pode ser um ponto acadêmico, mas estou tentando garantir que entenda os casos de uso mais comuns.
fonte
Não sei o que você quer dizer aqui. Qualquer divisão de múltiplas vias pode ser representada como uma série de divisões de duas vias. Para uma divisão de três vias, você pode dividir em A, B e C primeiro dividindo em A&B versus C e depois separando A de B.
Um determinado algoritmo pode não escolher essa sequência específica (especialmente se, como a maioria dos algoritmos, é ganancioso), mas certamente poderia. E se qualquer procedimento aleatório ou estético for feito como em florestas aleatórias ou em árvores potencializadas, as chances de encontrar a seqüência correta de divisões aumentam. Como outros já apontaram, as divisões de múltiplas vias são computacionalmente caras, portanto, dadas essas alternativas, a maioria dos pesquisadores parece ter escolhido divisões binárias.
Espero que isto ajude
fonte
Em relação aos usos da árvore de decisão e da divisão (binária versus outra), só conheço o CHAID que possui divisões não binárias, mas provavelmente existem outras. Para mim, o principal uso de uma divisão não binária é em exercícios de mineração de dados, onde eu estou procurando como otimizar uma variável nominal com muitos níveis. Uma série de divisões binárias não é tão útil quanto um agrupamento feito pelo CHAID.
fonte
Por favor leia isto
fonte