Projetos de ciência de dados explicados passo a passo?

10

Estou procurando um site ou livro em que vários exemplos práticos sejam dados passo a passo, explicando como eles escolhem os recursos relevantes, o procedimento de seleção de modelos, etc.

cpumar
fonte

Respostas:

2
Emre
fonte
1

Eu tive a mesma pergunta há algumas semanas atrás.

Pessoalmente, achei o Python para análise de dados de O'Reilly muito útil para aprender o básico. O livro pressupõe que você tenha alguma experiência em programação em python, mas também possui um apêndice na parte de trás para analisar o básico.

O autor fornece uma grande variedade de exemplos do mundo real (não Monty Python) no começo, que você pode criar nos primeiros capítulos e, em seguida, entra em detalhes sobre cada coisa à medida que o livro avança, desenvolvendo seu conhecimento.

Achei as instruções muito fáceis e passo a passo. Meu professor, que é meu guia em tudo isso, ficou impressionado com a rapidez com que aprendi.

Eu também ouvi coisas boas sobre o Kaggle.

Brian B.
fonte
1

Um lugar onde você pode encontrar algumas explicações passo a passo interessantes é o tutorial do Kaggle e as entrevistas dos vencedores . Muitas vezes, as pessoas publicam um resumo detalhado de sua abordagem.

anthr
fonte
Seu link está quebrado.
Pierre
@ Pierre - apenas corrigi-lo.
anthr
0

Um dos melhores livros que me deparei é o Machine Learning em Python, de Sebastian Raschka. Exemplos fáceis, explicação passo a passo e quantidade certa de matemática.

A estrutura do livro abrange todo o processo, desde a limpeza de dados até a montagem e avaliação.

HonzaB
fonte
0

Dê uma olhada em :

https://www.analyticsvidhya.com/blog/2016/01/complete-tutorial-learn-data-science-python-scratch-2/

Este possui um tutorial passo a passo que lhe dará uma idéia de todo o processo de Exploração de Dados, Análise de Dados e Construção de um modelo preditivo.

A explicação sobre a exploração de dados e a engenharia de recursos (como escolher recursos relevantes) está aqui:

https://www.analyticsvidhya.com/blog/2016/01/guide-data-exploration/

Veja os 5 primeiros conjuntos de dados aqui que têm tutoriais e trabalhem neles para obter experiência prática:

https://www.analyticsvidhya.com/blog/2016/10/17-ultimate-data-science-projects-to-boost-your-knowledge-and-skills/

Veja também:

http://machinelearningmastery.com/machine-learning-in-python-step-by-step/

onde ele usa vários modelos em um único conjunto de dados, o que lhe dará um entendimento básico de diferentes modelos.

Para entender mais sobre a seleção de modelos, consulte:

https://www.quora.com/Data-Science-How-do-Data-Scientists-perform-model-selection

O link acima tem respostas dadas por pessoas que trabalham no campo.

Para obter informações sobre diferentes conjuntos de dados, você sempre pode fazer login no kaggle, participar de competições e dar uma olhada na ampla variedade de conjuntos de dados, onde você tem acesso ao código das pessoas nos kernels. Os fóruns do Kaggle são úteis quando as pessoas discutem sobre o uso de modelos diferentes para problemas e sua abordagem.

https://www.kaggle.com/

RRRK
fonte