Idéias de projetos de ciência de dados [fechado]

23

Não sei se este é o lugar certo para fazer essa pergunta, mas uma comunidade dedicada à ciência de dados deve ser o local mais apropriado na minha opinião.

Acabei de começar com Data Science e Machine Learning. Estou procurando idéias de projetos de longo prazo nas quais possa trabalhar por 8 meses.

Uma combinação de ciência de dados e aprendizado de máquina seria ótima.

Um projeto grande o suficiente para me ajudar a entender os principais conceitos e também implementá-los ao mesmo tempo seria muito benéfico.

Kevin Desai
fonte

Respostas:

27

Eu tentaria analisar e resolver um ou mais dos problemas publicados no Kaggle Competitions ( https://www.kaggle.com/competitions ). Observe que as competições são agrupadas de acordo com a complexidade esperada , de 101(parte inferior da lista) a Researche Featured(topo da lista). Uma banda vertical codificada por cores é uma orientação visual para agrupamento. Você pode avaliar o tempo que poderia gastar em um projeto ajustando a duração esperada da competição correspondente, com base em suas habilidades e experiência .

É possível encontrar várias idéias de projetos de ciência de dados navegando na seguinte Coursolvepágina da Web: https://www.coursolve.org/browse-needs?query=Data%20Science .

Se você possui habilidades e deseja trabalhar em um projeto real de ciência de dados , focado em impactos sociais , visite a DataKindpágina de projetos: http://www.datakind.org/projects . Mais projetos com foco em impactos sociais podem ser encontrados na Data Science for Social Goodpágina da irmandade: http://dssg.io/projects .

A página Idéias do Projeto de Ciência no My NASA Datasite parece outro local para se inspirar: http://mynasadata.larc.nasa.gov/804-2 .

Se você deseja usar dados abertos , esta longa lista de aplicativos Data.govpode fornecer algumas idéias interessantes de projetos de ciência de dados : http://www.data.gov/applications .

Aleksandr Blekh
fonte
5

Pegue algo da sua vida cotidiana. Crie preditores de engarrafamentos na sua região, crie recomendações de músicas personalizadas, analise o mercado de carros, etc. Escolha o problema real que você deseja resolver - isso não apenas o manterá motivado, mas também fará você percorrer todo o círculo de desenvolvimento da coleta de dados ao teste de hipóteses.

amiga
fonte
2
Obtendo os dados é frequentemente um dos o maior desafio :)
Patlaf
2

O curso de introdução ao Data Science que está sendo executado no Coursera agora inclui tarefas do projeto no mundo real, onde as empresas publicam seus problemas e os alunos são incentivados a resolvê-los. Isso é feito via coursolve.com (já mencionado aqui).

Mais informações aqui (você precisa estar matriculado no curso para ver esse link)

Alexey Grigorev
fonte