Estou procurando um site ou livro em que vários exemplos práticos sejam dados passo a passo, explicando como eles escolhem os recursos relevantes, o procedimento de seleção de modelos, etc.
Estou procurando um site ou livro em que vários exemplos práticos sejam dados passo a passo, explicando como eles escolhem os recursos relevantes, o procedimento de seleção de modelos, etc.
Se você deseja um livro orientado a aplicativos, considere o Aprendizado de Máquina Baseado em Modelo de Christopher Bishop . Ele tem mais livros técnicos que são bem vistos.
Se você está procurando muito código, a Programação Probabilística e os Métodos Bayesianos para Hackers é uma opção.
Outro livro introdutório com uma inclinação mais estatística é uma introdução à estatística de Aprendizagem com Aplicações em R . Novamente, os autores têm uma versão técnica bem conceituada do livro.
Eu tive a mesma pergunta há algumas semanas atrás.
Pessoalmente, achei o Python para análise de dados de O'Reilly muito útil para aprender o básico. O livro pressupõe que você tenha alguma experiência em programação em python, mas também possui um apêndice na parte de trás para analisar o básico.
O autor fornece uma grande variedade de exemplos do mundo real (não Monty Python) no começo, que você pode criar nos primeiros capítulos e, em seguida, entra em detalhes sobre cada coisa à medida que o livro avança, desenvolvendo seu conhecimento.
Achei as instruções muito fáceis e passo a passo. Meu professor, que é meu guia em tudo isso, ficou impressionado com a rapidez com que aprendi.
Eu também ouvi coisas boas sobre o Kaggle.
A Ciência de dados na nuvem com o Microsoft Azure Machine Learning e R é um livro gratuito que funciona através de um exemplo em grande detalhe. Não se deixe levar pelas ferramentas específicas usadas, pois você não precisa delas para obter algum benefício com o livro.
Outro que eu gostei é de Programação de Inteligência Coletiva, que também passa por vários projetos em detalhes, incluindo a parte de scraping da Web que a maioria dos livros encobre.
Posso recomendar esta coleção de cadernos Ipython, que inclui cadernos comentados de ciência de dados, estatística e aprendizado de máquina.
https://github.com/ipython/ipython/wiki/A-gallery-of-interesting-IPython-Notebooks
Um lugar onde você pode encontrar algumas explicações passo a passo interessantes é o tutorial do Kaggle e as entrevistas dos vencedores . Muitas vezes, as pessoas publicam um resumo detalhado de sua abordagem.
Um dos melhores livros que me deparei é o Machine Learning em Python, de Sebastian Raschka. Exemplos fáceis, explicação passo a passo e quantidade certa de matemática.
A estrutura do livro abrange todo o processo, desde a limpeza de dados até a montagem e avaliação.
fonte
Dê uma olhada em :
https://www.analyticsvidhya.com/blog/2016/01/complete-tutorial-learn-data-science-python-scratch-2/
Este possui um tutorial passo a passo que lhe dará uma idéia de todo o processo de Exploração de Dados, Análise de Dados e Construção de um modelo preditivo.
A explicação sobre a exploração de dados e a engenharia de recursos (como escolher recursos relevantes) está aqui:
https://www.analyticsvidhya.com/blog/2016/01/guide-data-exploration/
Veja os 5 primeiros conjuntos de dados aqui que têm tutoriais e trabalhem neles para obter experiência prática:
https://www.analyticsvidhya.com/blog/2016/10/17-ultimate-data-science-projects-to-boost-your-knowledge-and-skills/
Veja também:
http://machinelearningmastery.com/machine-learning-in-python-step-by-step/
onde ele usa vários modelos em um único conjunto de dados, o que lhe dará um entendimento básico de diferentes modelos.
Para entender mais sobre a seleção de modelos, consulte:
https://www.quora.com/Data-Science-How-do-Data-Scientists-perform-model-selection
O link acima tem respostas dadas por pessoas que trabalham no campo.
Para obter informações sobre diferentes conjuntos de dados, você sempre pode fazer login no kaggle, participar de competições e dar uma olhada na ampla variedade de conjuntos de dados, onde você tem acesso ao código das pessoas nos kernels. Os fóruns do Kaggle são úteis quando as pessoas discutem sobre o uso de modelos diferentes para problemas e sua abordagem.
https://www.kaggle.com/
fonte