Perguntas com a marcação «cart»

'Árvores de classificação e regressão'. O CART é uma técnica popular de aprendizado de máquina e forma a base de técnicas como florestas aleatórias e implementações comuns de máquinas de aumento de gradiente.

78
Um exemplo: regressão do LASSO usando glmnet para resultado binário

Estou começando a se envolver com o uso de glmnetcom LASSO Regressão onde meu desfecho de interesse é dicotômica. Criei um pequeno quadro de dados simulado abaixo: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67,...

65
Perguntas práticas sobre o ajuste de florestas aleatórias

Minhas perguntas são sobre florestas aleatórias. O conceito deste classificador bonito é claro para mim, mas ainda há muitas questões práticas de uso. Infelizmente, não encontrei nenhum guia prático de RF (estive procurando por algo como "Um Guia Prático para Treinamento de Máquinas Boltzman...

45
O que é Deviance? (especificamente em CART / rpart)

O que é "desvio", como é calculado e quais são seus usos em diferentes campos nas estatísticas? Em particular, estou pessoalmente interessado em seus usos no CART (e sua implementação no rpart no R). Estou perguntando isso, já que o artigo wiki parece um pouco ausente e suas idéias serão muito...

38
Por que as árvores de decisão não são computacionalmente caras?

Em Introdução ao aprendizado estatístico com aplicações em R , os autores escrevem que o ajuste de uma árvore de decisão é muito rápido, mas isso não faz sentido para mim. O algoritmo precisa passar por todos os recursos e particioná-lo de todas as maneiras possíveis para encontrar a divisão ideal....

24
Quem inventou a árvore de decisão?

Estou tentando rastrear quem inventou a estrutura de dados e o algoritmo da árvore de decisão. Na entrada da Wikipedia sobre aprendizado de árvore de decisão, há uma alegação de que "ID3 e CART foram inventados de forma independente na mesma época (entre 1970 e 1980)". O ID3 foi apresentado...

23
CHAID vs CRT (ou CARRINHO)

Estou executando uma classificação de árvore de decisão usando o SPSS em um conjunto de dados com cerca de 20 preditores (categóricos com poucas categorias). CHAID (Detecção Automática de Interação Qui-Quadrado) e CRT / CART (Árvores de Classificação e Regressão) estão me dando árvores diferentes....

21
Como projetar um novo vetor no espaço PCA?

Depois de executar a análise de componentes principais (PCA), quero projetar um novo vetor no espaço do PCA (ou seja, encontrar suas coordenadas no sistema de coordenadas do PCA). Eu calculei o PCA na linguagem R usando prcomp. Agora eu devo poder multiplicar meu vetor pela matriz de rotação PCA....