Pesquisando sobre o algoritmo xgboost, examinei a documentação .
Nesta abordagem, as árvores são regularizadas usando a definição de complexidade que e são parâmetros, é o número de folhas terminais e é a pontuação em cada folha. γλTwj
Eu me pergunto: como isso define complexidade? , o número de nós terminais, parece natural para mim. Mas a soma das pontuações finais ao quadrado?
Talvez overfitting seja feito. Significando que pontuações muito grandes dão muita confiança? É escolhido para obter um aluno fraco? Qual é uma explicação natural para essa escolha da função complexidade?