Perguntas com a marcação «machine-learning»

15

Como dimensionar uma matriz de números inteiros assinados para variar de 0 a 1?

Estou usando o Brain para treinar uma rede neural em um conjunto de recursos que inclui valores positivos e negativos. Mas o Brain requer valores de entrada entre 0 e 1. Qual é a melhor maneira de normalizar meus

15

Por que as funções de ativação precisam ser monotônicas?

Atualmente, estou me preparando para um exame em redes neurais. Em vários protocolos de exames anteriores, li que as funções de ativação dos neurônios (nos perceptrons multicamadas) devem ser monotônicas. Entendo que as funções de ativação devem ser diferenciáveis, ter uma derivada que não é 0 na...

machine-learning neural-network

14

Por que os conjuntos são tão irracionalmente eficazes

Parece ter se tornado axiomático que um conjunto de alunos leve aos melhores resultados possíveis de modelos - e está se tornando muito mais raro, por exemplo, modelos únicos ganharem competições como o Kaggle. Existe uma explicação teórica para o porquê dos conjuntos serem tão efetivamente...

machine-learning data-mining predictive-modeling

14

Qual é a vantagem de manter o tamanho do lote com uma potência de 2?

Enquanto treinamos modelos em aprendizado de máquina, por que às vezes é vantajoso manter o tamanho do lote em uma potência de 2? Eu pensei que seria melhor usar um tamanho que seja o maior ajuste na sua memória GPU / RAM. Esta resposta afirma que, para alguns pacotes, uma potência de 2 é melhor...

machine-learning training

14

Como adicionar recursos sem imagem a imagens laterais como entrada de CNNs

Estou treinando uma rede neural convolucional para classificar imagens em condições de neblina (3 aulas). No entanto, para cada uma das cerca de 150.000 imagens, também tenho quatro variáveis meteorológicas disponíveis que podem ajudar a prever as classes das imagens. Fiquei imaginando como...

machine-learning neural-network deep-learning tensorflow cnn

14

Procurando por exemplo pilhas de infraestrutura / fluxos de trabalho / tubulações

Estou tentando entender como todos os componentes de "big data" funcionam juntos em um caso de uso do mundo real, por exemplo, hadoop, monogodb / nosql, storm, kafka, ... Eu sei que essa é uma ampla variedade de ferramentas usadas para tipos diferentes, mas gostaria de saber mais sobre a interação...

machine-learning bigdata efficiency scalability distributed

14

Quais são as implicações para o treinamento de um Tree Ensemble com conjuntos de dados altamente tendenciosos?

Eu tenho um conjunto de dados binários altamente tendencioso - tenho 1000x mais exemplos da classe negativa do que a classe positiva. Gostaria de treinar um conjunto de árvores (como árvores aleatórias extras ou uma floresta aleatória) nesses dados, mas é difícil criar conjuntos de dados de...

machine-learning feature-selection unbalanced-classes

14

Modelo de classificação binária para dados desequilibrados

Eu tenho um conjunto de dados com as seguintes especificações: Conjunto de dados de treinamento com 193.176 amostras com 2.821 positivos Conjunto de dados de teste com 82.887 amostras com 673 positivos Existem 10 recursos. Eu quero realizar uma classificação binária (0 ou 1). O problema que...

machine-learning python classification logistic-regression

14

Vantagens de empilhar LSTMs?

Gostaria de saber em que situações é vantajoso empilhar

machine-learning neural-network deep-learning lstm

14

Bibliotecas de aprendizado de máquina para Ruby

Existem bibliotecas de aprendizado de máquina para Ruby que são relativamente completas (incluindo uma grande variedade de algoritmos para aprendizado supervisionado e não supervisionado), testadas com robustez e bem documentadas? Eu amo o scikit-learn do Python por sua documentação incrível, mas...

machine-learning

14

O que significa a saída da função model.predict de Keras?

Criei um modelo LSTM para prever perguntas duplicadas no conjunto de dados oficial do Quora. Os rótulos de teste são 0 ou 1. 1 indica que o par de perguntas está duplicado. Depois de criar o modelo usando model.fit, eu testo o modelo usando model.predictos dados de teste. A saída é uma matriz de...

machine-learning python neural-network keras lstm

14

Dados de alta dimensão: o que são técnicas úteis para conhecer?

Devido a várias maldições da dimensionalidade , a precisão e a velocidade de muitas das técnicas preditivas comuns se degradam em dados de alta dimensão. Quais são algumas das técnicas / truques / heurísticas mais úteis que ajudam a lidar com dados de alta dimensão de maneira eficaz? Por...

machine-learning statistics dimensionality-reduction

14

Usando atributos para classificar / agrupar perfis de usuário

Eu tenho um conjunto de dados de usuários que compram produtos de um site. Os atributos que tenho são: ID do usuário, região (estado) do usuário, ID das categorias do produto, ID das palavras-chave do produto, ID das palavras-chave do site e valor das vendas gastas do produto. O objetivo é usar...

machine-learning data-mining classification clustering

14

propagação de volta na CNN

Eu tenho o seguinte CNN: Começo com uma imagem de entrada do tamanho 5x5 Em seguida, aplico a convolução usando o kernel 2x2 e stride = 1, que produz um mapa de recursos do tamanho 4x4. Em seguida, aplico o pool máximo 2x2 com stride = 2, que reduz o mapa de recursos para o tamanho 2x2. Então...

machine-learning convnet backpropagation cnn kernel

14

Existe uma classe de pessoa no ImageNet? Existem classes relacionadas aos seres humanos?

Se eu olhar para uma das muitas fontes para as aulas da Imagenet na Internet, não consigo encontrar uma única classe relacionada aos seres humanos (e não, o harvestman não é alguém que colhe, mas é o que eu conhecia como um pai de pernas longas, uma espécie de aranha :-). Como isso é possível? Eu...

machine-learning deep-learning dataset convnet image-classification

14

Upload de pasta de imagens do meu sistema para o Google Colab

Quero treinar um modelo de aprendizado profundo em um conjunto de dados contendo cerca de 3000 imagens. Como o conjunto de dados é enorme, quero usar o Google colab, pois é compatível com GPU. Como faço para carregar esta pasta de imagem completa no meu notebook e

machine-learning neural-network deep-learning dataset colab

14

A amostragem estratificada é necessária (floresta aleatória, Python)?

Eu uso o Python para executar um modelo de floresta aleatório no meu conjunto de dados desequilibrado (a variável de destino era uma classe binária). Ao dividir o conjunto de dados de treinamento e teste, lutei para usar a amostragem estratificada (como o código mostrado) ou não. Até agora,...

machine-learning python random-forest sampling training

14

Livros de matemática para iniciantes para Machine Learning

Sou engenheiro de Ciência da Computação, sem formação em estatística ou matemática avançada. Estou estudando o livro Python Machine Learning de Raschka e Mirjalili, mas quando tentei entender a matemática do Machine Learning, não consegui entender o grande livro que um amigo me sugere Os elementos...

machine-learning statistics reference-request math

13

Qual é a diferença entre uma codificação quente e outra excluída?

Estou lendo uma apresentação e ela recomenda não usar a codificação deixar uma de fora, mas tudo bem com uma codificação quente. Eu pensei que ambos eram iguais. Alguém pode descrever quais são as diferenças entre

machine-learning data-mining feature-selection feature-extraction feature-engineering

13

Uma alternativa de codificação quente para grandes valores categóricos?

Oi tenho dataframe com grandes valores categóricos acima de 1600 categorias existe alguma maneira de encontrar alternativas para que eu não tenha mais de 1600 colunas. Encontrei este link interessante abaixo http://amunategui.github.io/feature-hashing/#sourcecode Mas eles estão convertendo para...

machine-learning dataset dimensionality-reduction encoding