Perguntas com a marcação «classification»

228

O que significa AUC e o que é?

Pesquisou alta e baixa e não conseguiu descobrir o que a AUC, como relacionada à previsão, significa ou

136

Escolha de K na validação cruzada K-fold

Eu tenho usado o KKK validação cruzada fold algumas vezes agora para avaliar o desempenho de alguns algoritmos de aprendizagem, mas eu sempre fui intrigado a respeito de como eu deveria escolher o valor de KKK . Eu sempre vi e usei um valor de K= 10K=10K = 10 , mas isso parece totalmente...

machine-learning classification cross-validation

131

Kappa de Cohen em inglês comum

Estou lendo um livro de mineração de dados e ele mencionou a estatística Kappa como um meio de avaliar o desempenho de previsão dos classificadores. No entanto, eu simplesmente não consigo entender isso. Também verifiquei a Wikipedia, mas também não ajudou:

classification data-mining cohens-kappa

107

Por que a precisão não é a melhor medida para avaliar modelos de classificação?

Essa é uma pergunta geral que foi feita indiretamente várias vezes aqui, mas falta uma única resposta autoritativa. Seria ótimo ter uma resposta detalhada para isso para referência. A precisão , a proporção de classificações corretas entre todas as classificações, é uma medida muito simples e...

machine-learning classification accuracy model-evaluation scoring-rules

92

Como você calcula a precisão e o recall para a classificação multiclasse usando a matriz de confusão?

Gostaria de saber como calcular precisão e recordar usando uma matriz de confusão para um problema de classificação de várias classes. Especificamente, uma observação só pode ser atribuída à sua classe / rótulo mais provável. Eu gostaria de calcular: Precisão = TP / (TP + FP) Rechamada = TP /...

machine-learning classification precision-recall multi-class

78

Como calcular a área sob a curva (AUC), ou a estatística c, manualmente

Estou interessado em calcular a área sob a curva (AUC), ou a estatística c, manualmente para um modelo de regressão logística binária. Por exemplo, no conjunto de dados de validação, tenho o valor verdadeiro da variável dependente, retenção (1 = retido; 0 = não retido), bem como um status de...

regression logistic classification roc auc

77

Como produzir um gráfico bonito dos resultados da análise de agrupamentos k-means?

Estou usando R para fazer cluster K-significa. Estou usando 14 variáveis para executar K-means Qual é uma maneira bonita de traçar os resultados dos meios K? Existem implementações existentes? Ter 14 variáveis complica a plotagem dos resultados? Encontrei algo chamado GGcluster que parece...

data-visualization classification k-means unsupervised-learning

76

Ajude-me a entender as máquinas de vetores de suporte

Entendo o básico do objetivo de um Support Vector Machines em termos de classificação de um conjunto de entradas em várias classes diferentes, mas o que não entendo são alguns detalhes minuciosos. Para começar, estou um pouco confuso com o uso de Slack Variables. Qual é o seu propósito? Estou com...

machine-learning classification svm

76

Seleção de recursos para o modelo "final" ao executar validação cruzada no aprendizado de máquina

Estou ficando um pouco confuso sobre a seleção de recursos e o aprendizado de máquina e fiquei imaginando se você poderia me ajudar. Eu tenho um conjunto de dados de microarray que é classificado em dois grupos e possui milhares de recursos. Meu objetivo é obter um pequeno número de genes (meus...

machine-learning classification cross-validation feature-selection genetics

75

Por que a regressão logística não é chamada de Classificação Logística?

Como a Regressão Logística é um modelo de classificação estatística que lida com variáveis dependentes categóricas, por que não é chamado de Classificação Logística ? O nome "Regressão" não deve ser reservado aos modelos que lidam com variáveis dependentes...

regression machine-learning logistic classification terminology

75

Melhor maneira de apresentar uma floresta aleatória em uma publicação?

Estou usando o algoritmo de floresta aleatória como um classificador robusto de dois grupos em um estudo de microarray com milhares de recursos. Qual é a melhor maneira de apresentar a floresta aleatória para que haja informações suficientes para torná-la reproduzível em um artigo? Existe um...

r machine-learning classification random-forest microarray

73

Por que as redes neurais estão se tornando mais profundas, mas não mais amplas?

Nos últimos anos, as redes neurais convolucionais (ou talvez as redes neurais profundas em geral) tornaram-se cada vez mais profundas, com redes de ponta passando de 7 camadas ( AlexNet ) a 1000 camadas ( Redes Residuais) no espaço de 4 anos. A razão por trás do aumento no desempenho de uma rede...

machine-learning classification neural-networks deep-learning conv-neural-network

72

Como calcular a precisão / recall para a classificação multiclass-multilabel?

Eu estou querendo saber como calcular medidas de precisão e recall para classificação de várias etiquetas multiclass, ou seja, classificação onde há mais de dois rótulos e onde cada instância pode ter vários

machine-learning classification precision-recall multi-class

66

Como plotar curvas ROC na classificação multiclasse?

Em outras palavras, em vez de ter um problema de duas classes, estou lidando com 4 classes e ainda gostaria de avaliar o desempenho usando a

classification roc

63

Função Softmax vs Sigmoid no classificador Logístico?

O que decide a escolha da função (Softmax vs Sigmoid) em um classificador Logístico? Suponha que existem 4 classes de saída. Cada uma das funções acima fornece as probabilidades de cada classe ser a saída correta. Então, qual levar para um

machine-learning logistic classification softmax

60

Como posso ajudar a garantir que os dados de teste não vazem para os dados de treinamento?

Suponha que tenhamos alguém construindo um modelo preditivo, mas que alguém não seja necessariamente versado em princípios estatísticos ou de aprendizado de máquina adequados. Talvez estejamos ajudando essa pessoa enquanto ela está aprendendo, ou talvez essa pessoa esteja usando algum tipo de...

machine-learning classification predictive-models cross-validation out-of-sample

55

Alternativas à regressão logística em R

Eu gostaria de ter muitos algoritmos que executam a mesma tarefa que a regressão logística. Ou seja, algoritmos / modelos que podem fornecer uma previsão para uma resposta binária (Y) com alguma variável explicativa (X). Eu ficaria feliz se, depois de nomear o algoritmo, se você também mostrar...

r regression logistic classification predictive-models

53

Quando os dados desequilibrados são realmente um problema no Machine Learning?

Já tínhamos várias perguntas sobre dados desequilibrados ao usar regressão logística , SVM , árvores de decisão , empacotamento e várias outras perguntas semelhantes, o que o torna um tópico muito popular! Infelizmente, cada uma das perguntas parece ser específica do algoritmo e não encontrei...

machine-learning classification predictive-models unbalanced-classes

52

Classificação binária com classes fortemente desequilibradas

Eu tenho um conjunto de dados na forma de (recursos, saída binária 0 ou 1), mas 1 acontece muito raramente, portanto, sempre prevendo 0, obtenho precisão entre 70% e 90% (dependendo dos dados específicos que vejo) ) Os métodos de ML me dão a mesma precisão e, acredito, deve haver alguns métodos...

machine-learning classification binary-data unbalanced-classes

52

Qual é a diferença entre Multiclass e Multilabel Problem

Qual é a diferença entre um problema de várias classes e um problema de várias

classification clustering terminology multi-class multilabel