TLDR:
A rede neural convolucional é uma subclasse de redes neurais que possuem pelo menos uma camada de convolução. Eles são ótimos para capturar informações locais (por exemplo, pixels vizinhos em uma imagem ou palavras ao redor em um texto), além de reduzir a complexidade do modelo (treinamento mais rápido, precisa de menos amostras, reduz a chance de sobreajuste).
Veja o gráfico seguinte, que retrata as várias arquiteturas neurais-redes, incluindo-neurais-redes deep-convencionais: .
Redes Neurais (NN) , ou mais precisamente Redes Neurais Artificiais (RNA) , é uma classe de algoritmos de Aprendizado de Máquina que recentemente recebeu muita atenção (novamente!) Devido à disponibilidade de Big Data e instalações de computação rápida (a maioria dos Deep Learning algoritmos são essencialmente diferentes variações de RNA).
A classe da RNA abrange várias arquiteturas, incluindo Redes Neurais Convolucionais ( CNN ), Redes Neurais Recorrentes ( RNN ), por exemplo, LSTM e GRU , Autoencoders e Deep Belief Networks . Portanto, a CNN é apenas um tipo de RNA.
De um modo geral, uma RNA é uma coleção de unidades conectadas e ajustáveis (também conhecidas como nós, neurônios e neurônios artificiais) que podem transmitir um sinal (geralmente um número com valor real) de uma unidade para outra. O número de (camadas de) unidades, seus tipos e a maneira como eles estão conectados são chamados de arquitetura de rede.
Uma CNN, em específico, possui uma ou mais camadas de unidades de convolução . Uma unidade de convolução recebe sua entrada de várias unidades da camada anterior que juntas criam uma proximidade. Portanto, as unidades de entrada (que formam uma pequena vizinhança) compartilham seus pesos.
As unidades de convolução (assim como as unidades de pool) são especialmente benéficas como:
- Eles reduzem o número de unidades na rede (já que são mapeamentos muitos para um ). Isso significa que há menos parâmetros a serem aprendidos, o que reduz a chance de adaptação excessiva, pois o modelo seria menos complexo do que uma rede totalmente conectada.
- Eles consideram o contexto / informações compartilhadas nos pequenos bairros. Esse futuro é muito importante em muitas aplicações, como imagem, vídeo, texto e processamento / mineração de fala, pois as entradas vizinhas (por exemplo, pixels, quadros, palavras, etc.) geralmente carregam informações relacionadas.
Leia o seguinte para obter mais informações sobre CNNs (profundas):
- Classificação ImageNet com redes neurais convolucionais profundas
- Aprofundando-se com as convoluções
O ps ANN não é "um sistema baseado livremente no cérebro humano", mas sim uma classe de sistemas inspirados nas conexões neuronais existentes no cérebro de animais.
Uma rede neural convolucional é aquela que possui camadas convolucionais . Se uma rede neural geral é, vagamente, inspirada por um cérebro humano (que não é muito preciso), a rede neural convolucional é inspirada pelo sistema do córtex visual, em humanos e outros animais (que é mais próximo da verdade) . Como o nome sugere, essa camada aplica a convolução com um filtro que pode ser aprendido (também conhecido como kernel ); como resultado, a rede aprende os padrões nas imagens: arestas, cantos, arcos e figuras mais complexas. A rede neural convolucional também pode conter outras camadas, comumente agrupadas e densas.
Recomendo o tutorial do CS231n sobre esse assunto: é muito detalhado e contém muitas visualizações muito agradáveis.
fonte