Perguntas com a marcação «cart»

10
Variável categórica de regressão linear R valor "oculto"

Este é apenas um exemplo que encontrei várias vezes, portanto não tenho dados de amostra. Executando um modelo de regressão linear em R: a.lm = lm(Y ~ x1 + x2) x1é uma variável contínua. x2é categórico e possui três valores, por exemplo, "Baixo", "Médio" e "Alto". No entanto, a saída fornecida...

10
Por que Anova () e drop1 () forneceram respostas diferentes para os GLMMs?

Eu tenho um GLMM do formulário: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Quando uso drop1(model, test="Chi"), obtenho resultados diferentes dos que utilizo Anova(model, type="III")na embalagem do carro ou summary(model). Estes dois...

10
Tamanho da árvore no aumento da árvore gradiente

O aumento da árvore de gradiente, conforme proposto por Friedman, usa as árvores de decisão com Jnós terminais (= folhas) como aprendizes base. Existem várias maneiras de cultivar uma árvore com exatamente Jnós, por exemplo, é possível cultivá-la em profundidade primeiro ou em primeiro lugar,...

9
Como escolher o número de divisões em rpart ()?

Eu tenho usado rpart.controlpara minsplit=2, e obteve os seguintes resultados de rpart()função. Para evitar o ajuste excessivo dos dados, preciso usar as divisões 3 ou 7? Não devo usar divisões 7? Por favor deixe-me saber. Variáveis ​​realmente usadas na construção de árvores: [1] ct_a ct_b...

9
Os avaliadores de árvores SEMPRE são tendenciosos?

Estou fazendo uma lição de casa sobre as Árvores de Decisão, e uma das perguntas que tenho que responder é "Por que os estimadores são construídos a partir de árvores, e como a ensacagem ajuda a reduzir sua variação?". Agora, eu sei que os modelos com excesso de ajuste tendem a ter um viés muito...

8
Regressão (não) linear na árvore de decisão foliar

É comum ter uma técnica de regressão diferente nas folhas de uma árvore de regressão (por exemplo, regressão linear)? Eu tenho procurado por ele na última hora, mas tudo o que encontro são implementações que têm um valor constante nas folhas das árvores. Existe uma razão pela qual isso é / não é...

8
Viés de seleção nas árvores

Em Modelagem Preditiva Aplicada de Kuhn e Johnson, os autores escrevem: Finalmente, essas árvores sofrem viés de seleção: preditores com um número maior de valores distintos são favorecidos em detrimento de preditores mais granulares (Loh e Shih, 1997; Carolin et al., 2007; Loh, 2010). Loh e...

8
O rpart usa divisões multivariadas por padrão?

Eu sei que a rpartfunção de R mantém os dados necessários para implementar a divisão multivariada, mas não sei se ele está realmente executando divisões multivariadas. Eu tentei pesquisá-lo on-line, olhando para os rpartdocumentos, mas não vejo nenhuma informação que ele possa fazer ou esteja...