Keras suporta tanto TensorFlow e Theano como backend: quais são as vantagens / desvantagens de escolher um contra o outro, além do fato de que, atualmente, nem todas as operações são implementadas com o backend
Keras suporta tanto TensorFlow e Theano como backend: quais são as vantagens / desvantagens de escolher um contra o outro, além do fato de que, atualmente, nem todas as operações são implementadas com o backend
Quero calcular a precisão, recall e pontuação F1 para o meu modelo binário KerasClassifier, mas não encontro nenhuma solução. Aqui está o meu código real: # Split dataset in train and test data X_train, X_test, Y_train, Y_test = train_test_split(normalized_X, Y, test_size=0.3,...
Fiquei me perguntando como é que vamos decidir quantos nós nas camadas ocultas e quantas camadas ocultas colocar quando construirmos uma arquitetura de rede neural. Entendo que a camada de entrada e saída depende do conjunto de treinamento que temos, mas como decidimos a camada oculta e a...
Do código Tensorflow : Tensorflow. RnnCell. num_units: int, The number of units in the LSTM cell. Não consigo entender o que isso significa. Quais são as unidades da célula LSTM. Entrada, saída e esquecer portões? Isso significa "número de unidades na camada de projeção recorrente para Deep...
As funções de ativação são usadas para introduzir não linearidades na saída linear do tipo w * x + bem uma rede neural. O que eu sou capaz de entender intuitivamente para as funções de ativação como sigmoide. Entendo as vantagens do ReLU, que evita neurônios mortos durante a retropropagação. No...
Do tutorial da Keras RNN: "RNNs são complicadas. A escolha do tamanho do lote é importante, a escolha da perda e do otimizador é crítica, etc. Algumas configurações não convergirão." Portanto, essa é uma pergunta mais geral sobre o ajuste dos hiperparâmetros de um LSTM-RNN no Keras. Gostaria de...
Eu tento entender o papel da derivada da função sigmóide nas redes neurais. Primeiro, planto a função sigmóide e derivada de todos os pontos da definição usando python. Qual é exatamente o papel desse derivado? import numpy as np import matplotlib.pyplot as plt def sigmoid(x): return 1 / (1...
Eu tenho usado redes neurais por um tempo agora. No entanto, uma coisa com a qual luto constantemente é a seleção de um otimizador para treinar a rede (usando backprop). O que eu costumo fazer é apenas começar com um (por exemplo, SGD padrão) e, em seguida, tentar outros de maneira aleatória....
Eu tenho um conjunto de dados com 3 classes com os seguintes itens: Classe 1: 900 elementos Classe 2: 15000 elementos Classe 3: 800 elementos Preciso prever as classes 1 e 3, que sinalizam desvios importantes da norma. A classe 2 é o caso "normal" padrão com o qual não me importo. Que tipo...
Ensacamento é a geração de múltiplos preditores que funcionam como um único preditor. A desistência é uma técnica que ensina às redes neurais a média de todas as sub-redes possíveis. Olhando para as competições mais importantes do Kaggle, parece que essas duas técnicas são usadas juntas com muita...
Estou fazendo um projeto sobre o problema de identificação do autor. Eu tinha aplicado a normalização tf-idf para treinar dados e, em seguida, treinei um svm nesses dados. Agora, ao usar o classificador, devo normalizar os dados de teste também. Eu sinto que o objetivo básico da normalização é...
Estou tendo alguma dificuldade em derivar a propagação com a ReLU e fiz algum trabalho, mas não tenho certeza se estou no caminho certo. Função de custo: 12(y−y^)212(y−y^)2\frac{1}{2}(y-\hat y)^2em queyyyé o valor real, e y é um valor previsto. Suponha também quex> 0 sempre.y^y^\hat...
Considere uma rede neural: Para um determinado conjunto de dados, dividimos em conjunto de treinamento, validação e teste. Suponha que façamos isso na proporção clássica 60:20:20 e evitemos o overfitting validando a rede verificando-a no conjunto de validação. Então, qual é a necessidade de...
Aqui, a resposta se refere a gradientes de fuga e explosão que têm sigmoidfunções de ativação semelhantes, mas, eu acho, Relutem uma desvantagem e é seu valor esperado. não há limitação para a saída do Relue, portanto, seu valor esperado não é zero. Lembro-me da época anterior à popularidade...
Estou trabalhando com uma pergunta do livro on-line: http://neuralnetworksanddeeplearning.com/chap1.html Eu posso entender que, se a camada de saída adicional for de 5 neurônios de saída, provavelmente poderia definir um viés de 0,5 e um peso de 0,5 cada para a camada anterior. Mas a pergunta...
Estou brincando um pouco com convnets. Especificamente, estou usando o conjunto de dados kaggle gatos contra cães, que consiste em 25000 imagens rotuladas como gato ou cachorro (12500 cada). Consegui atingir cerca de 85% de precisão de classificação no meu conjunto de testes, no entanto,...
Crio um corr()df a partir de um df original. O corr()df saiu 70 X 70 e é impossível de visualizar o mapa de calor ... sns.heatmap(df). Se eu tentar exibir corr = df.corr(), a tabela não se encaixa na tela e posso ver todas as correlações. É uma maneira de imprimir o todo, dfindependentemente do seu...
Suponha que tenhamos dois tipos de recursos de entrada, categóricos e contínuos. Os dados categóricos podem ser representados como um código A quente, enquanto os dados contínuos são apenas um vetor B no espaço de dimensão N. Parece que o simples uso de concat (A, B) não é uma boa escolha, pois A,...
Eu sei que não há uma resposta clara para essa pergunta, mas vamos supor que eu tenha uma enorme rede neural, com muitos dados e que eu queira adicionar um novo recurso na entrada. A "melhor" maneira seria testar a rede com o novo recurso e ver os resultados, mas existe um método para testar se o...
Estudei os tipos de função de ativação para redes neurais. As funções em si são bastante diretas, mas a diferença de aplicação não é totalmente clara. É razoável que se diferencie entre as funções do tipo lógico e linear, dependendo da saída binária / contínua desejada, mas qual é a vantagem da...