Estou usando o Brain para treinar uma rede neural em um conjunto de recursos que inclui valores positivos e negativos. Mas o Brain requer valores de entrada entre 0 e 1. Qual é a melhor maneira de normalizar meus
Estou usando o Brain para treinar uma rede neural em um conjunto de recursos que inclui valores positivos e negativos. Mas o Brain requer valores de entrada entre 0 e 1. Qual é a melhor maneira de normalizar meus
Atualmente, estou me preparando para um exame em redes neurais. Em vários protocolos de exames anteriores, li que as funções de ativação dos neurônios (nos perceptrons multicamadas) devem ser monotônicas. Entendo que as funções de ativação devem ser diferenciáveis, ter uma derivada que não é 0 na...
Parece ter se tornado axiomático que um conjunto de alunos leve aos melhores resultados possíveis de modelos - e está se tornando muito mais raro, por exemplo, modelos únicos ganharem competições como o Kaggle. Existe uma explicação teórica para o porquê dos conjuntos serem tão efetivamente...
Enquanto treinamos modelos em aprendizado de máquina, por que às vezes é vantajoso manter o tamanho do lote em uma potência de 2? Eu pensei que seria melhor usar um tamanho que seja o maior ajuste na sua memória GPU / RAM. Esta resposta afirma que, para alguns pacotes, uma potência de 2 é melhor...
Estou treinando uma rede neural convolucional para classificar imagens em condições de neblina (3 aulas). No entanto, para cada uma das cerca de 150.000 imagens, também tenho quatro variáveis meteorológicas disponíveis que podem ajudar a prever as classes das imagens. Fiquei imaginando como...
Estou tentando entender como todos os componentes de "big data" funcionam juntos em um caso de uso do mundo real, por exemplo, hadoop, monogodb / nosql, storm, kafka, ... Eu sei que essa é uma ampla variedade de ferramentas usadas para tipos diferentes, mas gostaria de saber mais sobre a interação...
Eu tenho um conjunto de dados binários altamente tendencioso - tenho 1000x mais exemplos da classe negativa do que a classe positiva. Gostaria de treinar um conjunto de árvores (como árvores aleatórias extras ou uma floresta aleatória) nesses dados, mas é difícil criar conjuntos de dados de...
Eu tenho um conjunto de dados com as seguintes especificações: Conjunto de dados de treinamento com 193.176 amostras com 2.821 positivos Conjunto de dados de teste com 82.887 amostras com 673 positivos Existem 10 recursos. Eu quero realizar uma classificação binária (0 ou 1). O problema que...
Gostaria de saber em que situações é vantajoso empilhar
Existem bibliotecas de aprendizado de máquina para Ruby que são relativamente completas (incluindo uma grande variedade de algoritmos para aprendizado supervisionado e não supervisionado), testadas com robustez e bem documentadas? Eu amo o scikit-learn do Python por sua documentação incrível, mas...
Criei um modelo LSTM para prever perguntas duplicadas no conjunto de dados oficial do Quora. Os rótulos de teste são 0 ou 1. 1 indica que o par de perguntas está duplicado. Depois de criar o modelo usando model.fit, eu testo o modelo usando model.predictos dados de teste. A saída é uma matriz de...
Devido a várias maldições da dimensionalidade , a precisão e a velocidade de muitas das técnicas preditivas comuns se degradam em dados de alta dimensão. Quais são algumas das técnicas / truques / heurísticas mais úteis que ajudam a lidar com dados de alta dimensão de maneira eficaz? Por...
Eu tenho um conjunto de dados de usuários que compram produtos de um site. Os atributos que tenho são: ID do usuário, região (estado) do usuário, ID das categorias do produto, ID das palavras-chave do produto, ID das palavras-chave do site e valor das vendas gastas do produto. O objetivo é usar...
Eu tenho o seguinte CNN: Começo com uma imagem de entrada do tamanho 5x5 Em seguida, aplico a convolução usando o kernel 2x2 e stride = 1, que produz um mapa de recursos do tamanho 4x4. Em seguida, aplico o pool máximo 2x2 com stride = 2, que reduz o mapa de recursos para o tamanho 2x2. Então...
Se eu olhar para uma das muitas fontes para as aulas da Imagenet na Internet, não consigo encontrar uma única classe relacionada aos seres humanos (e não, o harvestman não é alguém que colhe, mas é o que eu conhecia como um pai de pernas longas, uma espécie de aranha :-). Como isso é possível? Eu...
Quero treinar um modelo de aprendizado profundo em um conjunto de dados contendo cerca de 3000 imagens. Como o conjunto de dados é enorme, quero usar o Google colab, pois é compatível com GPU. Como faço para carregar esta pasta de imagem completa no meu notebook e
Eu uso o Python para executar um modelo de floresta aleatório no meu conjunto de dados desequilibrado (a variável de destino era uma classe binária). Ao dividir o conjunto de dados de treinamento e teste, lutei para usar a amostragem estratificada (como o código mostrado) ou não. Até agora,...
Sou engenheiro de Ciência da Computação, sem formação em estatística ou matemática avançada. Estou estudando o livro Python Machine Learning de Raschka e Mirjalili, mas quando tentei entender a matemática do Machine Learning, não consegui entender o grande livro que um amigo me sugere Os elementos...
Estou lendo uma apresentação e ela recomenda não usar a codificação deixar uma de fora, mas tudo bem com uma codificação quente. Eu pensei que ambos eram iguais. Alguém pode descrever quais são as diferenças entre
Oi tenho dataframe com grandes valores categóricos acima de 1600 categorias existe alguma maneira de encontrar alternativas para que eu não tenha mais de 1600 colunas. Encontrei este link interessante abaixo http://amunategui.github.io/feature-hashing/#sourcecode Mas eles estão convertendo para...