Sendo novo no aprendizado de máquina em geral, gostaria de começar a brincar e ver quais são as possibilidades.
Estou curioso para saber quais aplicativos você recomendaria que ofereceriam o tempo mais rápido desde a instalação até a produção de um resultado significativo.
Além disso, todas as recomendações para bons materiais de introdução sobre o aprendizado de máquina em geral serão apreciadas.
machine-learning
Steve Kallestad
fonte
fonte
Respostas:
Eu recomendaria começar com algum MOOC sobre aprendizado de máquina. Por exemplo, Andrew Ng's curso de na coursera.
Você também deve dar uma olhada no aplicativo Orange . Ele possui uma interface gráfica e provavelmente é mais fácil entender algumas técnicas de ML usando-o.
fonte
Para ser sincero, acho que fazer alguns projetos lhe ensinará muito mais do que fazer um curso completo. Um dos motivos é que fazer um projeto é mais motivador e aberto do que realizar tarefas.
Um curso, se você tiver tempo e motivação (motivação real), é melhor do que fazer um projeto. Os outros comentaristas fizeram boas recomendações de plataforma sobre tecnologia.
Eu acho que, do ponto de vista do projeto divertido, você deve fazer uma pergunta e obter um computador para aprender a respondê-la.
Algumas boas perguntas clássicas que têm bons exemplos são:
Esses projetos têm a matemática concluída, o código concluído e podem ser encontrados com o Google prontamente.
Outros assuntos legais podem ser feitos por você!
Por fim, pesquisei robótica, então para mim as aplicações mais divertidas são comportamentais. Exemplos podem incluir (se você pode jogar com um arduino)
Crie um aplicativo, que use regressão logística, talvez, que aprenda quando desligar e ligar o ventilador, dada a temperatura interna e o status da luz na sala.
Crie um aplicativo que ensine um robô a mover um atuador, talvez uma roda, com base na entrada do sensor (talvez um pressionamento de botão), usando os Modelos de Mistura Gaussiana (aprendendo com a demonstração).
Enfim, esses são bem avançados. O que estou afirmando é que, se você escolher um projeto que você realmente gosta e passar algumas semanas nele, aprenderá uma quantidade enorme e entenderá muito mais do que fará algumas tarefas.
fonte
Acho Weka é um bom ponto de partida. Você pode fazer várias coisas, como aprendizado supervisionado ou clustering, e comparar facilmente um grande conjunto de algoritmos e metodologias.
O manual de Weka é na verdade um livro sobre aprendizado de máquina e mineração de dados que pode ser usado como material introdutório.
fonte
Supondo que você esteja familiarizado com a programação, eu recomendaria examinar o scikit-learn . Possui páginas de ajuda especialmente agradáveis, que podem servir como mini-tutoriais / um rápido tour pelo aprendizado de máquina. Escolha uma área que achar interessante e analise os exemplos.
fonte
Eu encontrei o curso de Introdução à Aprendizagem de Máquina no pluralsight como um ótimo recurso, então comece com. Ele usa a biblioteca Encog para explorar rapidamente diferentes técnicas de ml.
fonte
Se você já conhece o R Studio, o pacote de intercalação é um bom lugar para começar. Aqui estão alguns tutoriais:
Com R e acento circunflexo, você pode carregar e unir facilmente conjuntos de dados, redução de recursos, análise de componentes principais e treinar e prever usando vários algoritmos.
fonte
Se você pode reproduzir a grade 6x3 dos gráficos do banner do http://scikit-learn.org/ página , então você aprenderá alguns ML e alguns Python. Você não mencionou um idioma. O Python é fácil o suficiente para aprender muito rapidamente, e o scikit-learn possui uma ampla gama de algoritmos implementados.
Então tente seus próprios dados!
fonte
Além dos cursos e tutoriais publicados, eu sugeriria algo um pouco mais prático: o Kaggle tem algumas competições introdutórias que podem despertar seu interesse (a maioria das pessoas começa com a competição do Titanic). E há uma grande variedade de assuntos para explorar e competir quando você deseja obter mais experiência.
fonte
Como mencionado nas respostas acima, compreenda os conceitos básicos de ML, seguindo MOOCs do Prof.Andrew Ng e 'Learning From Data' do Prof. Yaser Abu-Mostafa.
R é o vencedor claro como a ferramenta mais usada nas competições Kaggle. (Não esqueça de verificar os recursos no wiki e nos fóruns do Kaggle)
Aprenda R e Python básicos. Trilha Coursera 'Ciência Dados' tem um curso de R introdutório . Quase todos os algoritmos podem ser encontrados nas bibliotecas Python e R. Sinta-se livre para usar os algoritmos que você aprendeu em algumas competições de kaggle. Como ponto de partida, compare o desempenho de vários algoritmos no conjunto de dados do Titanic e no reconhecedor de dígitos no kaggle .
E continue praticando em vários conjuntos de dados!
fonte