A documentação afirma que R gbm com distribution = "adaboost" pode ser usado para o problema de classificação 0-1. Considere o seguinte fragmento de código:
gbm_algorithm <- gbm(y ~ ., data = train_dataset, distribution = "adaboost", n.trees = 5000)
gbm_predicted <- predict(gbm_algorithm, test_dataset, n.trees = 5000)
Pode ser encontrado na documentação que prevê.gbm
Retorna um vetor de previsões. Por padrão, as previsões estão na escala de f (x).
No entanto, a escala específica não é clara para o caso de distribuição = "adaboost".
Alguém poderia ajudar com a interpretação de predict.gbm retornar valores e fornecer uma idéia de conversão para a saída 0-1?
Respostas:
O método adaboost fornece as previsões em escala de logit. Você pode convertê-lo na saída 0-1:
observe o 2 * dentro do logis
fonte
Você também pode obter diretamente as probabilidades da
predict.gbm
função;fonte
A função de link adaboost é descrita aqui . Este exemplo fornece uma descrição detalhada da computação:
fonte