Quando o aprendizado profundo é um exagero?

14

Por exemplo, para classificar e-mails como spam, vale a pena - de uma perspectiva de tempo / precisão - aplicar aprendizado profundo (se possível) em vez de outro algoritmo de aprendizado de máquina? O aprendizado profundo tornará desnecessários outros algoritmos de aprendizado de máquina como o ingênuo Bayes ?

Alexander
fonte

Respostas:

13

É tudo sobre retorno do investimento . Se DL é "vale a pena fazer", não é um exagero.

Se o custo do uso do DL (ciclos de computador, armazenamento, tempo de treinamento) for aceitável e os dados disponíveis para treiná-lo forem abundantes, e se a vantagem marginal sobre algoritmos alternativos for valiosa, o DL será uma vitória.

Mas, como você sugere, se o seu problema é passível de métodos alternativos, especialmente se ele oferece um sinal que combina bem com métodos clássicos, como regressão ou Bayes ingênuo, ou se o seu problema exige explicação de por que o limite de decisão é onde está (por exemplo, árvores de decisão), ou se seus dados não possuem os gradientes contínuos necessários para o DL (especialmente CNNs) ou se os dados variam ao longo do tempo, o que exigiria reciclagem periódica (especialmente em intervalos imprevisíveis), então o DL provavelmente é uma incompatibilidade para você.

Randy
fonte
11

O aprendizado profundo é poderoso, mas é não um método superior de bayesiana. Eles funcionam bem no que foram projetados para fazer:

Use aprendizado profundo:

  • O custo da computação é muito mais barato que o custo da amostragem (por exemplo: processamento em linguagem natural)
  • Se você tiver um problema altamente não linear
  • Se você deseja simplificar a engenharia de recursos
  • Se você não possui distribuição prévia (por exemplo: ajuste dos pesos para gaussiano aleatório). Ou você faz, mas não se importa com a complexidade.
  • Se você deseja precisão na velocidade (o aprendizado profundo é lento)

Use bayesiano ingênuo:

  • Se você tem uma distribuição anterior que deseja usar
  • Se você deseja atualizar seu modelo de maneira rápida e fácil (em particular modelos de conjuntos)
  • Se você possui sua própria função de probabilidade e deseja "controlar" como exatamente o modelo funciona
  • Se você deseja modelar modelos hierárquicos
  • Se você não deseja ajustar os parâmetros
  • Se você deseja um modelo mais rápido, tanto em treinamento quanto em execução
  • Se você quiser assumir a independência
  • Se você deseja evitar o super ajuste (esse é um modelo muito simples)
Olá Mundo
fonte