Pesquisou alta e baixa e não conseguiu descobrir o que a AUC, como relacionada à previsão, significa ou
A classificação estatística é o problema de identificar a subpopulação à qual novas observações pertencem, onde a identidade da subpopulação é desconhecida, com base em um conjunto de dados de treinamento contendo observações cuja subpopulação é conhecida. Portanto, essas classificações mostrarão um comportamento variável que pode ser estudado por estatísticas.
Pesquisou alta e baixa e não conseguiu descobrir o que a AUC, como relacionada à previsão, significa ou
Eu tenho usado o KKK validação cruzada fold algumas vezes agora para avaliar o desempenho de alguns algoritmos de aprendizagem, mas eu sempre fui intrigado a respeito de como eu deveria escolher o valor de KKK . Eu sempre vi e usei um valor de K= 10K=10K = 10 , mas isso parece totalmente...
Estou lendo um livro de mineração de dados e ele mencionou a estatística Kappa como um meio de avaliar o desempenho de previsão dos classificadores. No entanto, eu simplesmente não consigo entender isso. Também verifiquei a Wikipedia, mas também não ajudou:
Essa é uma pergunta geral que foi feita indiretamente várias vezes aqui, mas falta uma única resposta autoritativa. Seria ótimo ter uma resposta detalhada para isso para referência. A precisão , a proporção de classificações corretas entre todas as classificações, é uma medida muito simples e...
Gostaria de saber como calcular precisão e recordar usando uma matriz de confusão para um problema de classificação de várias classes. Especificamente, uma observação só pode ser atribuída à sua classe / rótulo mais provável. Eu gostaria de calcular: Precisão = TP / (TP + FP) Rechamada = TP /...
Estou interessado em calcular a área sob a curva (AUC), ou a estatística c, manualmente para um modelo de regressão logística binária. Por exemplo, no conjunto de dados de validação, tenho o valor verdadeiro da variável dependente, retenção (1 = retido; 0 = não retido), bem como um status de...
Estou usando R para fazer cluster K-significa. Estou usando 14 variáveis para executar K-means Qual é uma maneira bonita de traçar os resultados dos meios K? Existem implementações existentes? Ter 14 variáveis complica a plotagem dos resultados? Encontrei algo chamado GGcluster que parece...
Entendo o básico do objetivo de um Support Vector Machines em termos de classificação de um conjunto de entradas em várias classes diferentes, mas o que não entendo são alguns detalhes minuciosos. Para começar, estou um pouco confuso com o uso de Slack Variables. Qual é o seu propósito? Estou com...
Estou ficando um pouco confuso sobre a seleção de recursos e o aprendizado de máquina e fiquei imaginando se você poderia me ajudar. Eu tenho um conjunto de dados de microarray que é classificado em dois grupos e possui milhares de recursos. Meu objetivo é obter um pequeno número de genes (meus...
Como a Regressão Logística é um modelo de classificação estatística que lida com variáveis dependentes categóricas, por que não é chamado de Classificação Logística ? O nome "Regressão" não deve ser reservado aos modelos que lidam com variáveis dependentes...
Estou usando o algoritmo de floresta aleatória como um classificador robusto de dois grupos em um estudo de microarray com milhares de recursos. Qual é a melhor maneira de apresentar a floresta aleatória para que haja informações suficientes para torná-la reproduzível em um artigo? Existe um...
Nos últimos anos, as redes neurais convolucionais (ou talvez as redes neurais profundas em geral) tornaram-se cada vez mais profundas, com redes de ponta passando de 7 camadas ( AlexNet ) a 1000 camadas ( Redes Residuais) no espaço de 4 anos. A razão por trás do aumento no desempenho de uma rede...
Eu estou querendo saber como calcular medidas de precisão e recall para classificação de várias etiquetas multiclass, ou seja, classificação onde há mais de dois rótulos e onde cada instância pode ter vários
Em outras palavras, em vez de ter um problema de duas classes, estou lidando com 4 classes e ainda gostaria de avaliar o desempenho usando a
O que decide a escolha da função (Softmax vs Sigmoid) em um classificador Logístico? Suponha que existem 4 classes de saída. Cada uma das funções acima fornece as probabilidades de cada classe ser a saída correta. Então, qual levar para um
Suponha que tenhamos alguém construindo um modelo preditivo, mas que alguém não seja necessariamente versado em princípios estatísticos ou de aprendizado de máquina adequados. Talvez estejamos ajudando essa pessoa enquanto ela está aprendendo, ou talvez essa pessoa esteja usando algum tipo de...
Eu gostaria de ter muitos algoritmos que executam a mesma tarefa que a regressão logística. Ou seja, algoritmos / modelos que podem fornecer uma previsão para uma resposta binária (Y) com alguma variável explicativa (X). Eu ficaria feliz se, depois de nomear o algoritmo, se você também mostrar...
Já tínhamos várias perguntas sobre dados desequilibrados ao usar regressão logística , SVM , árvores de decisão , empacotamento e várias outras perguntas semelhantes, o que o torna um tópico muito popular! Infelizmente, cada uma das perguntas parece ser específica do algoritmo e não encontrei...
Eu tenho um conjunto de dados na forma de (recursos, saída binária 0 ou 1), mas 1 acontece muito raramente, portanto, sempre prevendo 0, obtenho precisão entre 70% e 90% (dependendo dos dados específicos que vejo) ) Os métodos de ML me dão a mesma precisão e, acredito, deve haver alguns métodos...
Qual é a diferença entre um problema de várias classes e um problema de várias