Eu tinha uma pergunta sobre o parâmetro de profundidade de interação em gbm em R. Esta pode ser uma pergunta noob, pela qual peço desculpas, mas como o parâmetro, que acredito denota o número de nós terminais em uma árvore, indica basicamente X-way interação entre os preditores? Apenas tentando entender como isso funciona. Além disso, recebo modelos bem diferentes se eu tiver um conjunto de dados com, digamos, duas variáveis de fator diferentes versus o mesmo conjunto de dados, exceto que essas duas variáveis de fator sejam combinadas em um único fator (por exemplo, níveis X no fator 1, níveis Y no fator 2, a variável combinada tem Fatores X * Y). O último é significativamente mais preditivo que o primeiro. Eu pensava que o aumento da profundidade da interação pegaria esse relacionamento.
fonte
Link entre a interação.depth e o número de nós do terminal
interaction.depth
interaction.depth
Link entre a interação.depth e a ordem de interação
O link entre
interaction.depth
e ordem de interação é mais tedioso.Em vez de raciocínio com o interaction.depth, vamos raciocinar com o número de nós terminais, que vamos chamados J .
Exemplo: Digamos que você tenha J = 4 nós de terminal (interação.depth = 3), você pode:
fonte
A resposta anterior não está correta.
Os tocos terão uma interação. Profundidade de 1 (e duas folhas). Mas interação.depth = 2 dá três folhas.
Então: NumberOfLeaves = interação.depth + 1
fonte
Na verdade, as respostas anteriores estão incorretas.
Cada um desses níveis tem2k
que é equivalente a:
fonte
Podes tentar
tabela (prever (gbm (y ~., dados = TrainingData, distribuição = "gaussian", detalhado = FALSE, n.trees = 1, encolhimento = 0,01, bag.fraction = 1, interação.depth = 1), n.trees = 1))
e veja que existem apenas 2 valores previstos exclusivos. interação.depth = 2, você obterá 3 valores previstos distintos. E se convencer.
fonte