Perguntas com a marcação «machine-learning»

11

Existem casos em que não há k ideal em k-médias?

Isso está em minha mente há pelo menos algumas horas. Eu estava tentando encontrar um k ideal para a saída do algoritmo k-means (com uma métrica de similaridade de cosseno ), então acabei plotando a distorção em função do número de clusters. Meu conjunto de dados é uma coleção de 800 documentos em...

machine-learning clustering k-means

11

Estendendo modelos de 2 classes a problemas de várias classes

Este documento no Adaboost fornece algumas sugestões e códigos (página 17) para estender os modelos de 2 classes para problemas da classe K. Gostaria de generalizar esse código, para que eu possa conectar facilmente diferentes modelos de 2 classes e comparar os resultados. Como a maioria dos...

r machine-learning classification statistical-learning multi-class

11

Como melhoro a estabilidade da minha rede neural?

Estou usando a rede neural em R para criar um NN com 14 entradas e uma saída. Eu construo / treino a rede várias vezes usando os mesmos dados de treinamento de entrada e a mesma arquitetura / configurações de rede. Depois que cada rede é produzida, eu a uso em um conjunto autônomo de dados de...

r machine-learning neural-networks

11

Qual é a Drosophila da IA agora?

Em meados da década de 1960, os pesquisadores se referiram ao xadrez como a " Drosophila da IA": como a mosca da fruta, o jogo de xadrez era acessível e um problema relativamente simples de se experimentar, que ainda produzia conhecimentos importantes e problemas mais complexos. Agora, as pessoas...

machine-learning

11

Cálculo da dimensão VC de uma rede neural

Se eu tiver alguma topologia fixa não recorrente (DAG) (conjunto fixo de nós e arestas, mas o algoritmo de aprendizado puder variar o peso nas arestas) de neurônios sigmóides com neurônios de entrada que só podem receber cadeias em como entrada e conduz a uma saída (que gera um valor real que...

machine-learning neural-networks algorithms vc-dimension

11

Qual é a vantagem de reduzir a dimensionalidade dos preditores para fins de regressão?

Quais são as aplicações ou vantagens das técnicas de regressão de redução de dimensão (DRR) ou redução de dimensionalidade supervisionada (SDR) sobre as técnicas de regressão tradicionais (sem nenhuma redução de dimensionalidade)? Essa classe de técnicas encontra uma representação em baixa dimensão...

regression machine-learning pca dimensionality-reduction

11

Avaliação de classificadores: curvas de aprendizado versus curvas ROC

Gostaria de comparar dois classificadores diferentes para um problema de classificação de texto em várias classes que usa grandes conjuntos de dados de treinamento. Duvido que eu deva usar curvas ROC ou curvas de aprendizado para comparar os dois classificadores. Por um lado, as curvas de...

machine-learning classification roc accuracy

11

Qual é a distância de Mahalanobis e como é usada no reconhecimento de padrões?

Alguém pode me explicar o conceito de distância de Mahalanobis? Por exemplo, qual é a distância de Mahalanobis entre dois pontos x e y, e especialmente, como é interpretada para reconhecimento de

machine-learning mathematical-statistics distance-functions

11

Medidas de separabilidade de classe em problemas de classificação

Um exemplo de uma boa medida de separabilidade de classe em alunos discriminantes lineares é a razão de discriminante linear de Fisher. Existem outras métricas úteis para determinar se os conjuntos de recursos fornecem uma boa separação de classe entre as variáveis de destino? Em particular,...

machine-learning classification feature-selection discriminant-analysis

11

Importância das variáveis na regressão logística

Provavelmente, estou lidando com um problema que provavelmente já foi resolvido centenas de vezes antes, mas não tenho certeza de onde encontrar a resposta. Ao meio de regressão logística, dadas muitas características tentando prever um valor categórico binário y , estou interessado em selecionar...

machine-learning logistic classification

11

Como você pode detectar se um processo gaussiano é excessivo?

Estou treinando um processo gaussiano com um kernel ARD com muitos parâmetros, maximizando a confiabilidade marginal dos dados, em vez de validação cruzada. Suspeito que seja excessivo. Como posso testar essa suspeita em um contexto

machine-learning cross-validation gaussian-process

11

Matriz de covariância para distribuição Gaussiana de processos e Wishart

Estou lendo este artigo sobre Generalized Wishart Processes (GWP). O artigo calcula as covariâncias entre diferentes variáveis aleatórias (seguindo o Processo Gaussiano ) usando a função de covariância exponencial ao quadrado, ou seja, . Diz então que essa matriz de covariância segue o...

machine-learning normal-distribution covariance wishart nonparametric-bayes

11

Existe sobreajuste nessa abordagem de modelagem

Recentemente me disseram que o processo que segui (componente de uma tese de mestrado) poderia ser visto como excessivo. Estou procurando entender melhor isso e ver se os outros concordam. O objetivo desta parte do artigo é Compare o desempenho das árvores de regressão otimizada por gradiente...

machine-learning data-mining predictive-models

11

Comparar classificadores com base no AUROC ou na precisão?

Eu tenho um problema de classificação binária e experimento diferentes classificadores: quero comparar os classificadores. qual é uma medida melhor da AUC ou da precisão? E porque? Raondom Forest: AUC: 0.828 Accuracy: 79.6667 % SVM: AUC: 0.542 Accuracy: 85.6667

machine-learning classification auc

11

Como prever novos dados com regressão spline / suave

Alguém pode ajudar a dar uma explicação conceitual de como as previsões são feitas para novos dados ao usar suavizações / splines para um modelo preditivo? Por exemplo, dado um modelo criado usando gamboosto mboostpacote em R, com p-splines, como são feitas as previsões para novos dados? O que é...

regression machine-learning predictive-models splines

11

Formação matemática para redes neurais

Não tenho certeza se isso é apropriado para este site, mas estou começando meu MSE em ciência da computação (bacharelado em matemática aplicada) e quero ter uma sólida experiência em aprendizado de máquina (provavelmente vou fazer um doutorado). Um dos meus subinteresses é redes neurais. Qual é...

machine-learning neural-networks mathematical-statistics references

11

Motivação por trás das etapas aleatórias do algoritmo da floresta

O método com o qual estou familiarizado para construir uma floresta aleatória é o seguinte: (de http://www.stat.berkeley.edu/~breiman/RandomForests/cc_home.htm ) Para construir uma árvore na floresta, nós: Inicialize uma amostra do tamanho N, em que N é o tamanho do nosso conjunto de...

machine-learning classification random-forest

11

Como escolher o número de árvores em um modelo de regressão generalizada impulsionada?

Existe uma estratégia para escolher o número de árvores em um GBM? Especificamente, o ntreesargumento em R's gbmfunção. Não vejo por que você não deve definir ntreeso valor mais alto possível. Percebi que um número maior de árvores reduz claramente a variabilidade dos resultados de vários GBMs. Eu...

r machine-learning gbm

11

Gráfico de limite de decisão para um perceptron

Estou tentando traçar o limite de decisão de um algoritmo perceptron e estou realmente confuso sobre algumas coisas. Minhas instâncias de entrada estão no formato , basicamente uma instância de entrada 2D ( x 1 e x 2 ) e um valor alvo de classe binária ( y ) [1 ou 0].[ ( x1 1, x2) , y][(x1...

machine-learning neural-networks python decision-theory perceptron

11

Treinando uma rede neural de convolução

Atualmente, estou trabalhando em um software de reconhecimento de rosto que usa redes neurais de convolução para reconhecer rostos. Com base nas minhas leituras, concluí que uma rede neural convolucional compartilhou pesos, para economizar tempo durante o treinamento. Mas como adaptar a...

machine-learning neural-networks computer-vision backpropagation conv-neural-network