Estou usando as Redes Neurais para resolver diferentes problemas de aprendizado de máquina. Estou usando Python e pybrain, mas esta biblioteca está quase descontinuada. Existem outras boas alternativas em
Métodos e princípios de construção de "sistemas de computador que melhoram automaticamente com a experiência".
Estou usando as Redes Neurais para resolver diferentes problemas de aprendizado de máquina. Estou usando Python e pybrain, mas esta biblioteca está quase descontinuada. Existem outras boas alternativas em
Referindo-se às notas do curso de Stanford sobre Redes neurais convolucionais para reconhecimento visual , um parágrafo diz: "Infelizmente, as unidades ReLU podem ser frágeis durante o treinamento e podem" morrer ". Por exemplo, um grande gradiente que flui através de um neurônio ReLU pode fazer...
No MNIST para iniciantes em ML, eles definem entropia cruzada como Hy′(y):=−∑iy′ilog(yi)Hy′(y): =-∑EuyEu′registro(yEu)H_{y'} (y) := - \sum_{i} y_{i}' \log (y_i) yiyEuy_i é o valor de probabilidade previsto para a classeiEui ey′iyEu′y_i' é a verdadeira probabilidade para essa classe. Questão...
Estou apenas começando a desenvolver um aplicativo de aprendizado de máquina para fins acadêmicos. Atualmente, estou usando R e me treinando nele. No entanto, em muitos lugares, vi pessoas usando Python . O que as pessoas estão usando na academia e na indústria e qual é a
Atualmente, estou trabalhando na implementação da descida estocástica de gradiente SGD, para redes neurais usando propagação traseira, e enquanto eu entendo seu objetivo, tenho algumas perguntas sobre como escolher valores para a taxa de aprendizado. A taxa de aprendizado está relacionada à forma...
Ao escrever um artigo / fazer uma apresentação sobre um tópico sobre redes neurais, geralmente se visualiza a arquitetura das redes. Quais são as maneiras boas / simples de visualizar arquiteturas comuns
Eu construí meu modelo. Agora eu quero desenhar o diagrama da arquitetura de rede para o meu trabalho de pesquisa. O exemplo é mostrado
Estou apenas começando com um aprendizado de máquina e, até agora, tenho lidado com regressão linear sobre uma variável. Aprendi que existe uma hipótese, que é: hθ( x ) = θ0 0+ θ1 1xhθ(x)=θ0+θ1xh_\theta(x)=\theta_0+\theta_1x Para descobrir bons valores para os parâmetros e θ 1 , queremos...
Quais são as diferenças, se houver, entre um "cientista de dados" e um "engenheiro de aprendizado de máquina"? Ao longo do ano passado, o "engenheiro de aprendizado de máquina" começou a aparecer muito nas ofertas de emprego. Isso é particularmente notável em São Francisco, que é...
Alguém pode praticamente explicar a lógica por trás da impureza de Gini versus ganho de informação (com base na Entropia)? Qual métrica é melhor usar em diferentes cenários ao usar árvores de
Estou fazendo alguns problemas em uma aplicação de árvore de decisão / floresta aleatória. Estou tentando ajustar um problema que possui números e seqüências de caracteres (como o nome do país) como recursos. Agora, a biblioteca, o scikit-learn usa apenas números como parâmetros, mas quero injetar...
Eu estava começando a olhar para a área sob curva (AUC) e estou um pouco confuso sobre sua utilidade. Quando me expliquei pela primeira vez, a AUC parecia ser uma grande medida de desempenho, mas em minha pesquisa eu descobri que alguns afirmam que sua vantagem é quase sempre marginal, pois é...
Histórico do problema: Estou trabalhando em um projeto que envolve arquivos de log semelhantes aos encontrados no espaço de monitoramento de TI (para minha melhor compreensão do espaço de TI). Esses arquivos de log são dados de séries temporais, organizados em centenas / milhares de linhas de...
Como dividir aleatoriamente uma matriz de dados e o vetor de rótulo correspondente em um X_train, X_test, X_val, y_train, y_test, y_val com o Sklearn? Tanto quanto eu sei, sklearn.cross_validation.train_test_splitsó é capaz de se dividir em dois, não em três
Estive pensando nas Redes Neurais Recorrentes (RNN) e suas variedades e nas Redes Neurais Convolucionais (CNN) e suas variedades. Seria justo dizer esses dois pontos: Use CNNs para dividir um componente (como uma imagem) em subcomponentes (como um objeto em uma imagem, como o contorno do objeto...
Qual é a abordagem correta e o algoritmo de clustering para clustering de geolocalização? Estou usando o seguinte código para agrupar coordenadas de localização geográfica: import numpy as np import matplotlib.pyplot as plt from scipy.cluster.vq import kmeans2, whiten coordinates= np.array([...
A lógica geralmente afirma que, ao sobreajustar um modelo, sua capacidade de generalizar é limitada, embora isso possa significar apenas que a sobreajuste impede que um modelo melhore após uma certa complexidade. O ajuste excessivo faz com que os modelos piorem, independentemente da complexidade...
Estou usando o TensorFlow para experimentos principalmente com redes neurais. Embora eu tenha feito algumas experiências (XOR-Problem, MNIST, algumas coisas de Regressão, ...) agora, luto com a escolha da função de custo "correta" para problemas específicos, porque no geral eu poderia ser...
Minha tarefa de 'aprendizado de máquina' é separar o tráfego benigno da Internet do tráfego malicioso. No cenário do mundo real, a maioria (digamos 90% ou mais) do tráfego da Internet é benigna. Assim, senti que deveria escolher uma configuração de dados semelhante para treinar meus modelos também....
As redes neurais obtêm os melhores resultados nas tarefas de visão computacional (consulte MNIST , ILSVRC , Kaggle Galaxy Challenge ). Eles parecem superar todas as outras abordagens no Computer Vision. Mas também existem outras tarefas: Desafio da Atividade Molecular de Kaggle Regressão:...