O que há por trás da API de previsão do Google?

28

A API de previsão do Google é um serviço de nuvem em que o usuário pode enviar alguns dados de treinamento para treinar um classificador misterioso e depois solicitar que ele classifique os dados recebidos, por exemplo, para implementar filtros de spam ou prever as preferências do usuário.

Mas o que há nos bastidores?


fonte
2
Eu suspeito que eles estão esperando manter isso comercialmente confidencial!
onestop
Isso pode ser verdade, mas o vídeo (do verão de 2010) sugere que eles ainda estavam experimentando naquela época; então eu postei este Q esperando que alguns vazamentos aparecessem desde então.
6
Existem "vários" algoritmos que a API de previsão pode escolher ao treinar / prever seus dados. O mecanismo escolhe o que ele decide ser o melhor. Alguns usuários solicitaram um pouco mais de controle sobre essa seleção, goo.gl/mod/5EoA , mesmo que o algoritmo seja desconhecido. Os redditores especularam sobre o que há aqui, reddit.com/r/MachineLearning/comments/evdxb/… , mas o discurso estatístico está perdido para mim.
hyperslug
2
@hyperslug Publique como resposta, é bastante útil, então eu gostaria de aceitá-lo.

Respostas:

11

O Google está usando diferentes técnicas e algoritmos de aprendizado de máquina para treinamento e previsão. As estratégias para o aprendizado supervisionado em larga escala: 1. Subamostra 2. Paralelamente embaraçosamente alguns algoritmos 3. Descida gradiente distribuída 4. Voto por maioria 5. Mistura de parâmetros 6. Mistura de parâmetros iterativa

Eles devem treinar e prever o modelo com as diferentes técnicas de aprendizado de máquina e usando um algoritmo para decidir o melhor modelo e previsão a retornar.

  1. Subamostragem fornece desempenho inferior
  2. A mistura de parâmetros melhora, mas não é tão boa quanto todos os dados
  3. Algoritmos distribuídos retornam melhores classificadores mais rapidamente
  4. A mistura de parâmetros iterativos alcança todos os dados

Mas é claro que isso não está claro na documentação da API.

404Dreamer_ML
fonte