Redes neurais profundas - Apenas para classificação de imagens?

14

Todos os exemplos que encontrei usando crenças profundas ou redes neurais convolucionais os usam para classificação de imagens, detecção de chatacter ou reconhecimento de fala.

As redes neurais profundas também são úteis para tarefas clássicas de regressão, onde os recursos não são estruturados (por exemplo, não organizados em uma sequência ou grade)? Se sim, você pode dar um exemplo?

Julian
fonte
3
Sua primeira frase traz redes neurais convolucionais. Parece que você está confundindo-os com profundas redes de crenças. Eles não são os mesmos, embora ambos sejam formas de redes neurais.
MSalters
1
Eu concordo com o @msalters, mas diria que as redes de crenças profundas são realmente profundas e tiveram um sucesso limitado, enquanto as redes convolucionais são mais como filtros híbridos - adaptativos de imagem s em camadas convolucionais seguidas por nn raso.
seanv507
O que você quer dizer com "observações" sendo "não estruturadas (não organizadas em uma sequência ou grade)"? Você refere-se às imagens sendo "estruturadas" no sentido de que pixels individuais são organizados em uma grade? Mas então são características que são "estruturadas", não "observações" (essas seriam imagens individuais)?
Ameba diz Reinstate Monica
Eu diria que todas as redes de convolução são profundas, nem todas as redes profundas são convolução e, da mesma forma, todas as redes de crenças profundas são profundas, nem todas as redes profundas são redes de crenças profundas. Na verdade, você pode ter redes profundas que não são profundas nem convolucionais, elas tendem a ser difíceis de treinar. Certamente, ainda há margem para um debate inútil sobre terminologia.
Lyndon White
Você não pode aplicar uma rede convolucional a dados não estruturados (não em seqüência / grade etc). Basicamente, não faz sentido. Uma rede convolucional está intimamente relacionada a obter a transformação de Fourier da sua entrada - por exemplo, para seqüências que a convertam do domínio do tempo para o domínio da frequência.
Lyndon White

Respostas:

8

As características das imagens que as tornam passíveis de classificação com uma rede neural profunda são várias características (possivelmente milhões, senão bilhões de pixels com RGB, intensidade etc.) e se você tiver etiquetas precisas, não serão dados ruidosos. Hoje em dia, as câmeras são muito boas e não medem nada. Graças à Internet, agora temos muitas imagens rotuladas com precisão. Uma rede profunda pode expressar funções arbitrariamente complicadas, o que é um problema com dados barulhentos porque você pode facilmente superestimar o ruído, por isso muitos métodos de aprendizado tendem a penalizar modelos complicados. No caso do reconhecimento de imagem, no entanto, a verdadeira função parece realmente muito complicada, não temos idéia de como é a forma funcional e nem sabemos quais são os recursos relevantes em muitos casos.

Isso não significa que você não pode usar redes profundas para aprender funções que não têm nada a ver com imagens. Você só precisa ter muito cuidado com as desvantagens, principalmente porque é muito propenso a sobreajuste, mas também que é computacionalmente caro e pode levar muito tempo para ser treinado (hoje em dia não há tanto problema com SGD e GPUs paralelas). A outra desvantagem é que você tem muito pouca ou nenhuma interpretabilidade do modelo, o que realmente não importa para a classificação da imagem. Estamos apenas tentando fazer com que os computadores reconheçam a diferença entre um chimpanzé e um orangotango. A compreensão humana da fórmula não importa. Para outros domínios, especialmente diagnósticos médicos, pesquisa de políticas, etc., você deseja ou pode precisar de compreensão humana.

Adam Acosta
fonte
5

Claro que você pode usar redes neurais profundas para muitos problemas além do reconhecimento de imagem ou fala. O problema é se você realmente precisa.

As redes neurais profundas são muito mais poderosas que um simples MLP, mas também exigem mais recursos e são mais difíceis de desenvolver. Assim, eles são usados ​​em domínios realmente complexos. Você pode usá-los para resolver problemas mais fáceis, mas geralmente os modelos mais simples também obtêm bons resultados.

Usar redes neurais profundas para problemas fáceis será como matar moscas com uma bazuca, com certeza você as matará, mas não conseguiu encontrar uma maneira mais simples?

davidivad
fonte
2
Esta é uma não resposta. O que é fácil, o que é difícil? Prever o mercado de ações / extrapolar a partir de exemplos limitados / ... Existem muitos problemas difíceis, os nns profundos são bons em todos eles?
seanv507
Eu não disse que redes neurais profundas podem resolver qualquer coisa. O que eu quis dizer é que eles são usados ​​em domínios complexos nos quais você tem um grande número de entradas. Eu sei que eles não podem resolver todos os problemas, mas esse não é o objetivo desta pergunta. O ponto é enfatizar que eles poderiam ser aplicados a outros problemas, além do reconhecimento de imagem / fala, mas eles têm desvantagens que devem ser consideradas nos casos em que outros modelos poderiam ser aplicados.
Davidivad
5

Eu concordo com a resposta de davidivad. Mas também acho que a aplicação de redes neurais profundas às imagens é que as imagens (e, mais importante, as imagens rotuladas ) são relativamente baratas de serem coletadas. Em outros domínios, pode ser muito caro coletar dados em larga escala, especialmente dentro das restrições de uma empresa industrial ou governamental típica. Para compor esse problema, em muitas aplicações, o fenômeno de interesse é relativamente raro; portanto, existem poucos exemplos preciosos para aprender; portanto, mesmo um esforço de coleta de dados em escala relativamente grande pode render um pequeno número de membros de alguma classe.

Sycorax diz restabelecer Monica
fonte