Eu já vi dois programas de certificação de ciência de dados - o John Hopkins, disponível no Coursera, e o Cloudera .
Tenho certeza que existem outros por aí.
O conjunto de classes de John Hopkins está focado no R como um conjunto de ferramentas, mas abrange uma variedade de tópicos:
- Programação R
- limpeza e obtenção de dados
- Análise de dados
- Pesquisa reproduzível
- Inferência estatística
- Modelos de regressão
- Aprendizado de Máquina
- Desenvolvendo produtos de dados
- E o que parece ser uma tarefa de conclusão baseada em projeto semelhante ao Data Science Challenge de Cloudera
O programa Cloudera parece fino na superfície, mas procura responder a duas perguntas importantes - "Você conhece as ferramentas", "Você pode aplicar as ferramentas no mundo real". O programa deles consiste em:
- Introdução à Ciência de Dados
- Exame sobre ciência de dados
- Data Science Challenge (um cenário de projeto de ciência de dados do mundo real)
Não estou procurando uma recomendação para um programa ou uma comparação de qualidade.
Estou curioso sobre outras certificações por aí, os tópicos que abordam e a seriedade com que as certificações DS são vistas pela comunidade neste momento.
EDIT: Estas são todas ótimas respostas. Estou escolhendo a resposta correta por votos.
Respostas:
Fiz os dois primeiros cursos e também estou planejando fazer todos os outros. Se você não conhece o R, é um programa muito bom. Há tarefas e testes toda semana. Muitas pessoas acham alguns cursos muito difíceis. Você terá dificuldade se não tiver nenhuma experiência em programação (mesmo que eles digam que não é necessário).
Apenas lembre-se .. não é porque você pode dirigir um carro que você é um piloto de F1;)
fonte
Como ex-gerente de análise e atual cientista líder de dados, desconfio muito da necessidade de certificados de ciência de dados. O termo cientista de dados é bastante vago e o campo da ciência de dados está em sua infância. Um certificado implica algum tipo de padrão uniforme que falta apenas em ciência de dados, ainda é muito o oeste selvagem.
Embora um certificado provavelmente não o prejudique, acho que seria melhor gastar seu tempo desenvolvendo a experiência para saber quando usar uma certa abordagem e profundidade de entendimento para poder explicar essa abordagem a um público não técnico.
fonte
Os programas de certificação que você mencionou são realmente cursos de nível básico. Pessoalmente, acho que esses certificados mostram apenas a persistência de pessoas e podem ser úteis apenas para quem está se candidatando a estágios, não para os trabalhos reais de ciência de dados.
fonte
Lidero equipes de ciência de dados para uma grande empresa de Internet e já selecionei centenas de perfis e entrevistei dezenas para nossas equipes em todo o mundo. Muitos candidatos foram aprovados nos cursos e programas mencionados acima ou trazem credenciais semelhantes. Pessoalmente, também participei dos cursos, alguns são bons, outros são decepcionantes, mas nenhum deles faz de você um "cientista de dados".
Em geral, eu concordo com os outros aqui. Um certificado da Coursera ou Cloudera apenas indica um interesse, mas não move a agulha. Há muito mais a considerar e você pode ter um impacto maior fornecendo um repositório abrangente de seu trabalho (perfil do github, por exemplo) e conectando-se a outros cientistas de dados. Qualquer pessoa que contrate um perfil de ciência de dados sempre prefere ver seu trabalho anterior e estilo / habilidades de codificação.
fonte
Existem várias certificações em andamento, mas elas têm diferentes áreas de foco e estilo de ensino.
Eu prefiro o Analytics Edge no eDX muito mais do que a especialização de John Hopkins, pois é mais intenso e prático. A expectativa na especialização de John Hopkins é colocar de 3 a 4 horas por semana contra 11 a 12 horas por semana no Analytics Edge.
Do ponto de vista da indústria, tomo essas certificações como um sinal de interesse e não como nível de conhecimento que uma pessoa possui. Há muitos desistentes nesses MOOCs. Eu valorizo muito mais outras experiências (como participar de competições Kaggle) do que passar pela certificação XYZ no MOOC.
fonte
Não tenho certeza sobre a era da nuvem, mas um dos meus amigos se juntou ao John Hopkins e, em suas palavras, é "brilhante para você começar". Também foi recomendado por muitas pessoas. Estou planejando participar daqui a algumas semanas. No que diz respeito à seriedade, não acho que essas certificações o ajudarão a conseguir um emprego, mas certamente o ajudarão a aprender.
fonte
@OP: Escolher respostas por votos é a PIOR idéia.
Sua pergunta se torna um concurso de popularidade. Você deve procurar a resposta certa, duvido que você saiba o que está perguntando, saiba o que está procurando.
Para responder à sua pergunta:
P: quão seriamente as certificações do DS são vistas neste momento pela comunidade.
A: Qual é o seu objetivo em fazer esses cursos? Para o trabalho, para a escola, para o auto-aperfeiçoamento, etc? As aulas do Coursera são muito aplicadas, você não aprenderá muita teoria, elas são intencionalmente reservadas para a sala de aula.
No entanto, as aulas do Coursera são muito úteis. Eu diria que é equivalente a um ano de aula de estatística, em um programa de mestrado de dois anos.
Ainda não tenho certeza do seu reconhecimento no setor, porque o problema de como você realmente fez o curso? Quanto tempo você gastou? É muito mais fácil obter notas A nesses cursos do que um exame de lápis e papel em sala de aula. Portanto, há uma enorme variação de qualidade de pessoa para pessoa.
fonte
Eu acho que o efeito da certificação do coursera depende do indivíduo e das classes. O requisito diz que de 3 a 5 horas por semana, se você colocar mais, e o material abrir por muito mais do que 3 a 5 horas, essas classes e certificações podem ser equivalentes a uma forte base de conhecimento e experiência no campo . A ciência chega para quem a solicita.
fonte
Estou quase terminando a Johns Hopkins Data Science Specialization no Coursera (um curso e uma pedra angular para me formar). Vou apenas dar-lhe os prós e os contras, tentando mantê-lo o mais objetivo possível:
Prós :
Contras :
fonte
A melhor maneira de obter sucesso no trabalho que você deseja que mostre que pode fazê-lo.
Os MOOCs que você mencionou fornecerão uma boa base no básico e deverão ser suficientes para você começar a resolver seus próprios problemas de aprendizado de máquina / ciência de dados. Tente uma ou duas competições da Kaggle, que é uma ótima maneira de melhorar suas habilidades, e uma nota decente será de interesse para um potencial empregador. Publique seus resultados no Github usando algo como um Notebook iPython, que permitirá que seu trabalho seja visto e julgado facilmente.
Tente uma análise de outros conjuntos de dados públicos, como o Conjunto de dados de compartilhamento de bicicleta da UCI ou o Conjunto de dados de tratamento de diabetes da UCI, que são muito divertidos de experimentar e mostre que você está interessado e disposto a desenvolver suas habilidades.
fonte
Depende realmente da credibilidade da instituição que concedeu o certificado. Por exemplo, a Certificação de Ciência de Dados de uma empresa sediada em Harvard é reconhecida por muitos parceiros do setor e pode fazer uma boa escolha. Você não disse que tipo de certificado está procurando?
fonte
Valor para o aluno, saco misto. Pagar várias centenas de dólares por um programa ou cem dólares por um curso é um motivador.
Eu completei uma série, do MITx. É um curso de pesquisa e pós-graduação de métodos e ferramentas voltado para aqueles que precisam "conhecer" com mais detalhes. É aterramento suficiente, que me senti confortável aplicando o que aprendi.
Um curso autônomo da HarvardX sobre o método de gráfico acíclico direcionado era mais como um seminário de graduação em estatística sobre o método da Judea Pearl. Demoraria muito tempo até eu ouvir sobre isso, caso contrário.
A série HarvardX é um campo de treinamento de nível de pós-graduação que visa orientar o novo aluno para o conjunto de ferramentas e aplicativos R.
A série BerkeleyX é um curso de pesquisa de graduação que utiliza uma classe Python criada para fins específicos, que é quase uma linguagem específica de domínio.
Quanto ao valor dos certificados, só posso relatar que minha única experiência educacional relacionada era um mestrado em geofísica e eu tinha cerca de um ano de experiência paga fora da descrição de meu cargo (advogado sênior do banco).
Talvez como resultado dos certificados, eu tenha sido recusado como "superqualificado" por pelo menos dois trabalhos que conheço. Portanto, meu conselho é que, se você tiver um certificado, não o mencione se a palavra "Excel" aparecer no anúncio de emprego.
fonte
Alguns recursos no edX para cursos de ciência de dados da Harvard, MIT, Microsoft e outros que possam interessar a esse grupo.
Por exemplo, temos um programa de certificação profissional de Harvard que consiste em 8 cursos e um exame básico aqui .
Para estudos mais avançados, temos um programa MicroMasters do MIT aqui .
bem como um da UC San Diego aqui . Para uma ótima visão geral da Data Science, temos um programa da Microsoft. Para todos os nossos programas, você pode conferir aqui .
Espero que isto ajude,
Josh de edX
fonte