Alguém pode praticamente explicar a lógica por trás da impureza de Gini versus ganho de informação (com base na Entropia)? Qual métrica é melhor usar em diferentes cenários ao usar árvores de
Uma árvore de decisão é uma ferramenta de suporte à decisão que usa um gráfico ou modelo de decisão semelhante a uma árvore e suas possíveis consequências, incluindo resultados de eventos aleatórios, custos de recursos e utilidade. É uma maneira de exibir um algoritmo.
Alguém pode praticamente explicar a lógica por trás da impureza de Gini versus ganho de informação (com base na Entropia)? Qual métrica é melhor usar em diferentes cenários ao usar árvores de
Estou fazendo alguns problemas em uma aplicação de árvore de decisão / floresta aleatória. Estou tentando ajustar um problema que possui números e seqüências de caracteres (como o nome do país) como recursos. Agora, a biblioteca, o scikit-learn usa apenas números como parâmetros, mas quero injetar...
Eu não estava claro sobre alguns conceitos: O XGBoost converte alunos fracos em alunos fortes. Qual é a vantagem de fazer isso? Combinando muitos alunos fracos em vez de apenas usar uma única árvore? A Random Forest usa várias amostras da árvore para criar uma árvore. Qual é a vantagem desse...
Recentemente, um amigo meu foi questionado se os algoritmos da árvore de decisão são lineares ou não-lineares em uma entrevista. Tentei procurar respostas para essa pergunta, mas não consegui encontrar nenhuma explicação satisfatória. Alguém pode responder e explicar a solução para esta pergunta?...
A função de previsão abaixo também fornece valores -ve, portanto não podem ser probabilidades. param <- list(max.depth = 5, eta = 0.01, objective="binary:logistic",subsample=0.9) bst <- xgboost(param, data = x_mat, label = y_mat,nround = 3000) pred_s <- predict(bst, x_mat_s2) Eu google...
Crio um corr()df a partir de um df original. O corr()df saiu 70 X 70 e é impossível de visualizar o mapa de calor ... sns.heatmap(df). Se eu tentar exibir corr = df.corr(), a tabela não se encaixa na tela e posso ver todas as correlações. É uma maneira de imprimir o todo, dfindependentemente do seu...
Estou trabalhando em um problema de classificação. Eu tenho um conjunto de dados que contém um número igual de variáveis categóricas e variáveis contínuas. Como vou saber qual técnica usar? entre uma árvore de decisão e uma regressão logística? É certo assumir que a regressão logística será...
Para redes neurais, temos o teorema da aproximação universal, que afirma que as redes neurais podem aproximar qualquer função contínua em um subconjunto compacto de .RnRnR^n Existe um resultado semelhante para árvores com gradiente? Parece razoável, pois você pode continuar adicionando mais ramos,...
Eu tenho duas perguntas relacionadas às árvores de decisão: Se temos um atributo contínuo, como escolhemos o valor de divisão? Exemplo: Idade = (20,29,50,40 ....) Imagine que temos um atributo contínuo que têm valores em . Como posso escrever um algoritmo que encontre o ponto de divisão , para...
Em quais casos é melhor usar uma árvore de decisão e outros casos um KNN? Por que usar um deles em certos casos? E o outro em diferentes casos? (Observando sua funcionalidade, não o algoritmo) Alguém tem algumas explicações ou referências sobre
Se eu treinar meu modelo usando o seguinte código: import xgboost as xg params = {'max_depth':3, 'min_child_weight':10, 'learning_rate':0.3, 'subsample':0.5, 'colsample_bytree':0.6, 'obj':'reg:linear', 'n_estimators':1000, 'eta':0.3} features = df[feature_columns] target =
Problema 1: Estou confuso com a descrição do LightGBM sobre o modo como a árvore é expandida. Eles afirmam: A maioria dos algoritmos de aprendizado de árvore de decisão cresce em árvore por nível (profundidade), conforme a imagem a seguir: Perguntas 1 : Quais algoritmos "mais" são...
Suponha que eu tenha uma função suave como . Eu tenho um conjunto de treinamento D \ subsetneq \ {((x, y), f (x, y)) | (x, y) \ in \ mathbb {R} ^ 2 \} e, é claro, eu não sei f, embora possa avaliar f onde quiser. D ⊊ { ( ( x , y ) , f ( x , y ) ) | ( x , y ) ∈ R 2 } f ff( x , y) = x2+...
Estou trabalhando com um conjunto de dados com grande número de recursos categóricos (> 80%) prevendo uma variável de destino contínua (ou seja, Regressão). Eu tenho lido bastante sobre maneiras de lidar com recursos categóricos. E aprendi que a codificação one-hot que eu tenho usado no passado...
Eu tenho um conjunto de dados que possui um atributo de classe binária. Existem 623 casos com classe +1 (câncer positivo) e 101.671 casos com classe -1 (câncer negativo). Eu tentei vários algoritmos (Naive Bayes, Random Forest, AODE, C4.5) e todos eles têm taxas de falso-negativos inaceitáveis. A...
Eu tenho um conjunto de dados com 20000 amostras, cada uma com 12 recursos diferentes. Cada amostra está na categoria 0 ou 1. Quero treinar uma rede neural e uma floresta de decisão para categorizar as amostras para que eu possa comparar os resultados e as duas técnicas. A primeira coisa que me...
Eu estava analisando o classificador criado usando uma árvore de decisão. Há um parâmetro de ajuste chamado max_depth na árvore de decisão do scikit . Isso é equivalente a podar uma árvore de decisão? Caso contrário, como podar uma árvore de decisão usando o scikit? dt_ap =...
Eu tenho dois tensores a:[batch_size, dim] b:[batch_size, dim]. Quero fazer um produto interno para cada par do lote, gerando c:[batch_size, 1], onde c[i,0]=a[i,:].T*b[i,:].
Fechado . Esta questão precisa ser mais focada . No momento, não está aceitando respostas. Deseja melhorar esta pergunta? Atualize a pergunta para que ela se concentre apenas em um problema editando esta postagem . Fechado há 4 anos . Estou
Li a explicação da convolução e a compreendi até certo ponto. Alguém pode me ajudar a entender como essa operação se relaciona à convolução nas redes neurais convolucionais? O filtro é uma função gque aplica