Perguntas com a marcação «networks»

8
Qual é a relação da função objetivo de amostragem negativa (NS) com a função objetivo original no word2vec?

Eu estava lendo o modelo word2vec padrão / famoso e de acordo com as notas do standord para cs224n, a função objetivo muda de: Joriginal=−∑j=0,j≠m2mu⊤c−m+jvc+2mlog(∑k=1|V|exp(u⊤kvc))Joriginal=−∑j=0,j≠m2muc−m+j⊤vc+2mlog(∑k=1|V|exp(uk⊤vc))J_{original} = -\sum^{2m}_{j=0,j\neq m} u^\top_{c-m+j} v_c +...

7
Rede Convolucional 4D

Alguém sabe se existe uma generalização da rede convolucional que funciona com tensores de entrada 4D em vez de 3D. Geralmente, pelo que entendi, os filtros de rede convolucionais aceitam uma certa extensão de coordenadas x, y por filtro e toda a profundidade dessa extensão também. Eu tenho uma...

7
Como a normalização em lote calcula as estatísticas da população após o treinamento?

Eu estava lendo o documento de normalização em lote (BN) (1) e dizia: Para isso, uma vez treinada a rede, usamos a normalização x^=x−E[x]Var[x]+ϵ−−−−−−−−√x^=x−E[x]Var[x]+ϵ\hat{x} = \frac{x - E[x]}{ \sqrt{Var[x] + \epsilon}}usando a população , em vez de estatísticas de minilote. minha pergunta...

7
A camada ReLU funciona bem para uma rede superficial?

Atualmente, estou trabalhando no treinamento de uma rede neural de 5 camadas e tive alguns problemas com a camada tanh e gostaria de experimentar a camada ReLU. Mas descobri que isso se torna ainda pior para a camada ReLU. Gostaria de saber se é por isso que não encontrei os melhores parâmetros ou...

7
Qual é um exemplo de uso da diferenciação automática, como implementado no Tensorflow, e por que é importante?

Eu tenho uma compreensão decente de redes neurais, propagação traseira e regra de cadeia, no entanto, estou lutando para entender a diferenciação automática. A seguir, consulte a diferenciação automática fora do contexto da propagação de retorno: Como a diferenciação automática calcula o...