Perguntas com a marcação «deep-learning»

uma nova área de pesquisa de aprendizado de máquina relacionada às tecnologias usadas para aprender representações hierárquicas de dados, feitas principalmente com redes neurais profundas (ou seja, redes com duas ou mais camadas ocultas), mas também com algum tipo de modelo gráfico probabilístico.

95
Quando usar GRU sobre LSTM?

A principal diferença entre uma GRU e um LSTM é que uma GRU possui duas portas ( redefinir e atualizar portas), enquanto uma LSTM possui três portas (portas de entrada , saída e esquecimento ). Por que usamos GRU quando claramente temos mais controle sobre a rede através do modelo LSTM (como temos...

43
Número de parâmetros em um modelo LSTM

Quantos parâmetros possui um único LSTM empilhado? O número de parâmetros impõe um limite inferior ao número de exemplos de treinamento necessários e também influencia o tempo de treinamento. Portanto, conhecer o número de parâmetros é útil para treinar modelos usando

35
Explicação da perda de entropia cruzada

Suponha que eu crie um NN para classificação. A última camada é uma camada densa com ativação softmax. Eu tenho cinco classes diferentes para classificar. Suponha que, para um único exemplo de treinamento, true labelseja [1 0 0 0 0]enquanto estiverem as previsões [0.1 0.5 0.1 0.1 0.2]. Como eu...

33
Multi GPU em keras

Como você pode programar na biblioteca keras (ou tensorflow) para particionar o treinamento em várias GPUs? Digamos que você esteja em uma instância do Amazon ec2 com 8 GPUs e que gostaria de usá-los para treinar mais rapidamente, mas seu código é apenas para uma única CPU ou...

30
Artigo: Qual é a diferença entre Normalização de Camada, Normalização de Lote Recorrente (2016) e RNN Normalizada de Lote (2015)?

Então, recentemente, há um artigo sobre Normalização de Camadas . Há também uma implementação no Keras. Mas lembro-me de que existem artigos intitulados Normalização de Lote Recorrente (Cooijmans, 2016) e Redes Neurais Recorrentes Normalizadas em Lote (Laurent, 2015). Qual é a diferença entre...