Perguntas com a marcação «networks»

541

Como escolher o número de camadas e nós ocultos em uma rede neural feedforward?

Existe um método padrão e aceito para selecionar o número de camadas e o número de nós em cada camada em uma rede neural feed-forward? Estou interessado em maneiras automatizadas de construir redes

model-selection neural-networks

222

Tamanho do lote de troca versus número de iterações para treinar uma rede neural

Ao treinar uma rede neural, que diferença faz para definir: tamanho do lote para e o número de iterações paraumaumaabbb vs. tamanho do lote em número de iterações emcccddd onde ?a b = c dumab=cd ab = cd Em outras palavras, assumindo que treinamos a rede neural com a mesma quantidade de...

neural-networks train

187

O que a camada oculta em uma rede neural calcula?

Tenho certeza de que muitas pessoas responderão com links para 'deixe-me pesquisar no google por você', então quero dizer que tentei descobrir isso, por favor, perdoe minha falta de compreensão aqui, mas não consigo descobrir como o implementação prática de uma rede neural realmente funciona....

machine-learning neural-networks nonlinear-regression

175

Qual é o tamanho do lote na rede neural?

Estou usando Python Keras packagepara rede neural. Este é o link . É batch_sizeigual ao número de amostras de teste? Da Wikipedia, temos esta informação: No entanto, em outros casos, a avaliação do gradiente de soma pode exigir avaliações dispendiosas dos gradientes de todas as funções de soma....

neural-networks python terminology keras

147

O que devo fazer quando minha rede neural não aprende?

Estou treinando uma rede neural, mas a perda de treinamento não diminui. Como posso consertar isso? Não estou perguntando sobre ajuste excessivo ou regularização. Estou perguntando como resolver o problema em que o desempenho da minha rede não melhora no conjunto de treinamento . Essa questão é...

neural-networks deep-learning

141

Quais são as vantagens do ReLU sobre a função sigmóide em redes neurais profundas?

O estado da arte da não linearidade é usar unidades lineares retificadas (ReLU) em vez da função sigmóide em redes neurais profundas. Quais são as vantagens? Sei que treinar uma rede quando o ReLU é usado seria mais rápido e com inspiração biológica, quais são as outras vantagens? (Ou seja, alguma...

machine-learning neural-networks deep-learning

133

Uma lista de funções de custo usadas em redes neurais, juntamente com aplicativos

Quais são as funções de custo comuns usadas na avaliação do desempenho de redes neurais? Detalhes (fique à vontade para pular o restante desta pergunta, minha intenção aqui é simplesmente fornecer esclarecimentos sobre a notação que as respostas podem usar para ajudá-las a serem mais...

machine-learning neural-networks

123

Qual é a diferença entre redes neurais convolucionais, máquinas Boltzmann restritas e auto-codificadores?

Recentemente, tenho lido sobre aprendizagem profunda e estou confuso sobre os termos (ou digamos, tecnologias). Qual é a diferença entre Redes neurais convolucionais (CNN), Máquinas Boltzmann restritas (RBM) e Codificadores

neural-networks deep-learning conv-neural-network autoencoders rbm

114

Qual é a diferença entre uma rede neural e uma rede neural profunda e por que as mais profundas funcionam melhor?

Não vi a pergunta declarada precisamente nesses termos, e é por isso que faço uma nova pergunta. O que estou interessado em conhecer não é a definição de uma rede neural, mas entender a diferença real com uma rede neural profunda. Para mais contexto: eu sei o que é uma rede neural e como a...

neural-networks deep-learning

106

O que significa convolução 1x1 em uma rede neural?

Atualmente, estou fazendo o Udacity Deep Learning Tutorial. Na lição 3, eles falam sobre uma convolução 1x1. Essa convolução 1x1 é usada no Google Inception Module. Estou tendo problemas para entender o que é uma convolução 1x1. Eu também vi este post de Yann Lecun. Alguém poderia gentilmente me...

neural-networks deep-learning convolution conv-neural-network

94

Diferença entre decaimento do peso líquido neural e taxa de aprendizado

No contexto das redes neurais, qual é a diferença entre a taxa de aprendizado e a queda de peso?

neural-networks terminology

94

É possível treinar uma rede neural sem retropropagação?

Muitos livros e tutoriais de redes neurais gastam muito tempo com o algoritmo de retropropagação, que é essencialmente uma ferramenta para calcular o gradiente. Vamos supor que estamos construindo um modelo com ~ 10K parâmetros / pesos. É possível executar a otimização usando alguns algoritmos de...

machine-learning neural-networks optimization backpropagation

92

O que é uma camada de incorporação em uma rede neural?

Em muitas bibliotecas de redes neurais, existem 'camadas de incorporação', como em Keras ou Lasagne . Não sei se entendi sua função, apesar de ler a documentação. Por exemplo, na documentação do Keras, ele diz: Transforme números inteiros positivos (índices) em vetores densos de tamanho fixo,...

machine-learning neural-networks python word-embeddings

83

Como aplicar a Rede Neural à previsão de séries temporais?

Eu sou novo no aprendizado de máquina e tenho tentado descobrir como aplicar redes neurais à previsão de séries temporais. Encontrei recursos relacionados à minha consulta, mas ainda estou um pouco perdido. Eu acho que uma explicação básica sem muitos detalhes ajudaria. Digamos que tenho alguns...

time-series forecasting neural-networks

82

função de ativação tanh vs função de ativação sigmóide

A função de ativação tanh é: tanh(x)=2⋅σ(2x)−1tanh(x)=2⋅σ(2x)−1tanh \left( x \right) = 2 \cdot \sigma \left( 2 x \right) - 1 Onde , a função sigmóide, é definida como: .σ(x)σ(x)\sigma(x) σ(x)=ex1+exσ(x)=ex1+ex\sigma(x) = \frac{e^x}{1 + e^x} Questões: Realmente importa entre usar essas duas...

machine-learning neural-networks optimization cost-maximization

73

Por que as redes neurais estão se tornando mais profundas, mas não mais amplas?

Nos últimos anos, as redes neurais convolucionais (ou talvez as redes neurais profundas em geral) tornaram-se cada vez mais profundas, com redes de ponta passando de 7 camadas ( AlexNet ) a 1000 camadas ( Redes Residuais) no espaço de 4 anos. A razão por trás do aumento no desempenho de uma rede...

machine-learning classification neural-networks deep-learning conv-neural-network

71

Gere uma variável aleatória com uma correlação definida para uma (s) variável (s) existente (s)

Para um estudo de simulação, eu tenho que gerar variáveis aleatórias que mostram uma correlação pré-definida (população) com uma variável existente YYY. Examinei os Rpacotes copulae CDVineque podem produzir distribuições multivariadas aleatórias com uma determinada estrutura de dependência. No...

r correlation random-variable random-generation independence assumptions random-variable unbiased-estimator regression hypothesis-testing heteroscedasticity generalized-least-squares distributions networks data-visualization sas reproducible-research philosophical time-series variance outliers quality-control mean multilevel-analysis average weighted-mean regression confidence-interval prediction-interval correlation matlab matrix data-mining maximum-likelihood r time-series survival predictive-models

69

Por que os pesquisadores de redes neurais se preocupam com épocas?

Uma época em descida de gradiente estocástico é definida como uma única passagem pelos dados. Para cada minibatch SGD, amostras são coletadas, o gradiente calculado e os parâmetros atualizados. Na configuração de época, as amostras são coletadas sem substituição.kkk Mas isso parece desnecessário....

neural-networks deep-learning gradient-descent

68

Quais são os bons pesos iniciais em uma rede neural?

Acabo de ouvir que é uma boa ideia escolher pesos iniciais de uma rede neural no intervalo , onde é o número de entradas para um dado neurônio. Supõe-se que os conjuntos sejam normalizados - média 0, variação 1 (não sei se isso importa).(−1d√,1d√)(−1d,1d)(\frac{-1}{\sqrt d} , \frac{1}{\sqrt...

neural-networks normalization

67

Maneira correta de usar rede neural recorrente para análise de séries temporais

As redes neurais recorrentes diferem das "regulares" pelo fato de terem uma camada de "memória". Devido a essa camada, as NNs recorrentes devem ser úteis na modelagem de séries temporais. No entanto, não sei se entendi corretamente como usá-los. Digamos que possuo as seguintes séries temporais (da...

time-series machine-learning neural-networks