Eu estava ouvindo uma palestra e vi este slide: Quão verdadeiro é
Eu estava ouvindo uma palestra e vi este slide: Quão verdadeiro é
Para ilustrar minha pergunta, suponha que eu tenha um conjunto de treinamento em que a entrada tenha um grau de ruído, mas a saída não, por exemplo; # Training data [1.02, 1.95, 2.01, 3.06] : [1.0] [2.03, 4.11, 5.92, 8.00] : [2.0] [10.01, 11.02, 11.96, 12.04] : [1.0] [2.99, 6.06, 9.01, 12.10] :...
Bem, a pergunta já diz tudo. O que se entende por "pré-treinar uma rede neural"? Alguém pode explicar em inglês simples e puro? Não consigo encontrar recursos relacionados a ele. Seria ótimo se alguém pudesse me apontar para
Existe uma discussão semelhante aqui (a função de custo da rede neural não é convexa? ), Mas não consegui entender os pontos nas respostas e minha razão para perguntar novamente, esperando que isso esclareça alguns problemas: Se estou usando soma de função de custo diferença de quadrados, sou em...
Uma limitação dos algoritmos de rede neural padrão (como backprop) é que você precisa tomar uma decisão de design de quantas camadas ocultas e neurônios por camada deseja. Geralmente, a taxa de aprendizagem e a generalização são altamente sensíveis a essas opções. Esta foi a razão pela qual...
É frequentemente mencionado que as unidades lineares retificadas (ReLU) substituíram as unidades softplus porque são lineares e mais rápidas de calcular. O softplus ainda tem a vantagem de induzir esparsidade ou isso é restrito à ReLU? A razão pela qual pergunto é que me pergunto sobre as...
Bem, recentemente, eu estava trabalhando no aprendizado de algoritmos de impulso, como adaboost, aumento de gradiente, e eu sabia que o mais comumente usado é o árvores. Eu realmente quero saber se existem alguns exemplos bem-sucedidos recentes (refiro-me a alguns artigos ou artigos) para o uso de...
Fundo: Sim, a máquina de Boltzmann restrita (RBM) pode ser usada para iniciar os pesos de uma rede neural. Também PODE ser usado de maneira "camada por camada" para construir uma rede profunda de crenças (isto é, treinar uma ésima camada na parte superior da -ésima camada e depois treinar a ésima...
Aqui, dê uma olhada: Você pode ver exatamente onde os dados de treinamento terminam. Os dados de treinamento vão de a 1 .−1−1-1111 Usei Keras e uma rede densa 1-100-100-2 com ativação tanh. Calculo o resultado de dois valores, peq como p / q. Dessa forma, posso obter qualquer tamanho de número...
Esta pergunta já tem respostas aqui : Como a mudança na função de custo pode ser positiva? (1 resposta) O que devo fazer quando minha rede neural não aprende? (5 respostas) Fechado no mês passado . Estou treinando um modelo (Rede Neural Recorrente) para...
Para um modelo linear , o termo de retração é sempre .y= β0 0+ x β+ εy=β0+xβ+εy=\beta_0+x\beta+\varepsilonP( β)P(β)P(\beta) Qual é o motivo pelo qual não termo de viés (interceptação) ? Devemos reduzir o termo de viés nos modelos de redes neurais?β0 0β0
Gostaria de saber se existe um código para treinar uma rede neural convolucional para fazer a classificação de séries temporais. Eu vi alguns artigos recentes ( http://www.fer.unizg.hr/_download/repository/KDI-Djalto.pdf ), mas não tenho certeza se existe algo ou se eu mesmo o...
Essencialmente, minha pergunta é que, nos Perceptrons multicamadas, os perceptrons são usados com uma função de ativação sigmóide. De modo que na regra de actualização y é calculado comoy^y^\hat{y} y^=11+exp(−wTxi)y^=11+exp(−wTxi)\hat{y} = \frac{1}{1+\exp(-\mathbf{w}^T\mathbf{x}_i)} Como esse...
Eu estava lendo o documento de normalização em lote (BN) (1) e não entendia a necessidade de usar médias móveis para rastrear a precisão do modelo e, mesmo se eu aceitasse que era a coisa certa a fazer, não entendo o que eles estão fazendo exatamente. Para meu entendimento (o que posso estar...
A aplicação da função softmax em um vetor produzirá "probabilidades" e valores entre e . 000111 Mas também podemos dividir cada valor pela soma do vetor e isso produzirá probabilidades e valores entre e .000111 Eu li a resposta aqui, mas diz que a razão é porque é diferenciável, embora Ambas as...
Estou treinando uma rede neural (detalhes não importantes) em que os dados de destino são um vetor de ângulos (entre 0 e 2 * pi). Estou procurando conselhos sobre como codificar esses dados. Aqui está o que estou tentando atualmente (com sucesso limitado): 1) Codificação 1-de-C: divido os ângulos...
Por que a retropropagação não funciona quando você inicializa todo o peso com o mesmo valor (por exemplo, 0,5), mas funciona bem quando dados números aleatórios? O algoritmo não deveria calcular o erro e trabalhar a partir daí, apesar de os pesos serem inicialmente os
Estou tentando entender diferentes arquiteturas de redes neurais recorrentes (RNN) a serem aplicadas a dados de séries temporais e estou ficando um pouco confuso com os diferentes nomes que são frequentemente usados ao descrever RNNs. A estrutura da Memória de Longo Prazo (LSTM) e da Unidade...
Hoje em dia, com toda a mídia falando e falando sobre aprendizado profundo, eu li algumas coisas básicas. Acabei de descobrir que é apenas mais um método de aprendizado de máquina para aprender padrões a partir dos dados. Mas minha pergunta é: onde e por que esse método brilha? Por que toda a...
Eu tenho um modelo de rede neural profunda e preciso treiná-lo no meu conjunto de dados, que consiste em cerca de 100.000 exemplos, meus dados de validação contêm cerca de 1000 exemplos. Como leva tempo para treinar cada exemplo (cerca de 0,5s para cada exemplo) e para evitar o excesso de ajustes,...