Tutorial de aprendizado de máquina on-line

8

Alguém conhece alguns bons tutoriais sobre técnicas de aprendizado de máquina on-line? Ou seja, como ele pode ser usado em ambientes em tempo real, quais são as principais diferenças em comparação aos métodos normais de aprendizado de máquina, etc.

UPD: Obrigado a todos pelas respostas. Por "online", quero dizer métodos que podem ser treinados em tempo real, com base em novas entradas, uma a uma.

Igor Bobriakov
fonte
2
Você poderia esclarecer os principais aspectos de "online" em que está interessado? Você tem um formulário específico para os dados ou alguma opção para pré-treinar seu algoritmo antes da parte on-line?
perfil completo de Neil Slater
você quer analisar fluxos de dados?
Johnny000

Respostas:

5
  1. Existe uma biblioteca muito agradável de algoritmos de aprendizado de máquina on-line de um grupo da NTU, chamado LIBOL. Este seria um bom lugar para começar a experimentar os algoritmos.
    O guia do usuário que o acompanha e a publicação JMLR associada são introduções muito agradáveis ​​aos algoritmos básicos neste campo.
  2. A Avrim Blum tem um artigo de pesquisa mais antigo e mais técnico sobre algoritmos de aprendizado on-line.
tchakravarty
fonte
Os dois primeiros links estão mortos.
Suzana
1

Você pode ver se é possível misturar o streaming do Spark ( https://spark.apache.org/docs/1.1.0/streaming-programming-guide.html ) e a Spark ML Library ( https://spark.apache.org/docs /1.1.0/mllib-guide.html ).

O Spark Streaming permite processar fluxos de dados ao vivo e a Spark ML Library é uma Biblioteca de aprendizado de máquina para Spark. Então, talvez você possa fazer algo de bom!

Mas esse é um assunto muito interessante, estou trabalhando nisso. Pode ser bom criar uma comunidade do Google ( https://plus.google.com/communities )?

JC R
fonte
0

Há bastante no youtube e aqui está o famoso de Andrew Ng, da coursea: https://www.coursera.org/course/ml

alvas
fonte
Não estou 100% convencido pelos tópicos desse curso. Por exemplo, os SVMs são realmente úteis hoje em dia? Você nunca vê uma entrada vencedora do Kaggle que usava SVMs como parte principal.
Lembik
2
Eu acho que a pergunta do OP é especificamente sobre técnicas on-line - ou seja, onde o sistema deve aprender pelo menos parcialmente "no trabalho". Tutoriais
Neil Slater
Concordo com o @NeilSlater, já que o OP mencionou "comparado aos métodos normais de aprendizado de máquina".
Rohit
4
lol, "online" é ambíguo
alvas