Perguntas com a marcação «deep-learning»

7
Como a normalização em lote calcula as estatísticas da população após o treinamento?

Eu estava lendo o documento de normalização em lote (BN) (1) e dizia: Para isso, uma vez treinada a rede, usamos a normalização x^=x−E[x]Var[x]+ϵ−−−−−−−−√x^=x−E[x]Var[x]+ϵ\hat{x} = \frac{x - E[x]}{ \sqrt{Var[x] + \epsilon}}usando a população , em vez de estatísticas de minilote. minha pergunta...

7
Qual é um exemplo de uso da diferenciação automática, como implementado no Tensorflow, e por que é importante?

Eu tenho uma compreensão decente de redes neurais, propagação traseira e regra de cadeia, no entanto, estou lutando para entender a diferenciação automática. A seguir, consulte a diferenciação automática fora do contexto da propagação de retorno: Como a diferenciação automática calcula o...

7
Redução não linear de dimensionalidade: algoritmos geométricos / topológicos vs. autoencodificadores

Pelo que entendi, existem três abordagens principais para a redução não linear da dimensionalidade: Aprendizagem múltipla (algoritmos geométricos / topológicos como ISOMAP, LLE, LTSA) Autoencoders coisas que não se encaixam nas duas primeiras categorias (t-SNE inspirado em probabilidade, Kernel...

7
Descida gradiente de

Estou lendo Por que o Momentum Really Works , um post do novo diário de destilação. Parafraseando as principais equações que levam à parte que me confunde, o post descreve a intuição em mais detalhes. O algoritmo de descida de gradiente é dado pelo seguinte processo