O que você acha das certificações de ciência de dados?

35

Eu já vi dois programas de certificação de ciência de dados - o John Hopkins, disponível no Coursera, e o Cloudera .

Tenho certeza que existem outros por aí.

O conjunto de classes de John Hopkins está focado no R como um conjunto de ferramentas, mas abrange uma variedade de tópicos:

  • Programação R
  • limpeza e obtenção de dados
  • Análise de dados
  • Pesquisa reproduzível
  • Inferência estatística
  • Modelos de regressão
  • Aprendizado de Máquina
  • Desenvolvendo produtos de dados
  • E o que parece ser uma tarefa de conclusão baseada em projeto semelhante ao Data Science Challenge de Cloudera

O programa Cloudera parece fino na superfície, mas procura responder a duas perguntas importantes - "Você conhece as ferramentas", "Você pode aplicar as ferramentas no mundo real". O programa deles consiste em:

  • Introdução à Ciência de Dados
  • Exame sobre ciência de dados
  • Data Science Challenge (um cenário de projeto de ciência de dados do mundo real)

Não estou procurando uma recomendação para um programa ou uma comparação de qualidade.

Estou curioso sobre outras certificações por aí, os tópicos que abordam e a seriedade com que as certificações DS são vistas pela comunidade neste momento.

EDIT: Estas são todas ótimas respostas. Estou escolhendo a resposta correta por votos.

Steve Kallestad
fonte
4
Isso é muito amplo e primariamente baseado em opiniões. Dê uma olhada em datascience.stackexchange.com/help/dont-ask
asheeshr:
3
@AsheeshR - Estamos com uma média de 2 perguntas por dia e 2 respostas por pergunta. Nesse ponto, o foco precisa estar no incentivo à participação e no aumento do interesse.
Steve Kallestad
10
O envolvimento em detrimento da qualidade do site não é a solução. O engajamento é transitório. A qualidade é muito mais difícil de alterar posteriormente.
asheeshr
4
Bicicletas , local de trabalho , finanças pessoais e dinheiro , céticos , desenvolvimento de jogos lançados com menos de 10 perguntas por dia. Bicicletas foi lançada com 4 por dia, porque era considerado um site de alta qualidade.
asheeshr
3
Bem ... Acho que tenho que declarar o vencedor neste momento. :)
Steve Kallestad

Respostas:

13

Fiz os dois primeiros cursos e também estou planejando fazer todos os outros. Se você não conhece o R, é um programa muito bom. Há tarefas e testes toda semana. Muitas pessoas acham alguns cursos muito difíceis. Você terá dificuldade se não tiver nenhuma experiência em programação (mesmo que eles digam que não é necessário).

Apenas lembre-se .. não é porque você pode dirigir um carro que você é um piloto de F1;)

Patlaf
fonte
32

Como ex-gerente de análise e atual cientista líder de dados, desconfio muito da necessidade de certificados de ciência de dados. O termo cientista de dados é bastante vago e o campo da ciência de dados está em sua infância. Um certificado implica algum tipo de padrão uniforme que falta apenas em ciência de dados, ainda é muito o oeste selvagem.

Embora um certificado provavelmente não o prejudique, acho que seria melhor gastar seu tempo desenvolvendo a experiência para saber quando usar uma certa abordagem e profundidade de entendimento para poder explicar essa abordagem a um público não técnico.

neone4373
fonte
2
Às vezes, é difícil obter experiência se o seu trabalho atual não estiver focado em ciência de dados, mas em algum campo relacionado (no meu caso, estatísticas). Uso os cursos para obter algum conhecimento e permanecer no tópico, o que não posso fazer no meu trabalho diurno.
Christian Sauer
11
Concordo plenamente, os cursos são muito valiosos para fornecer um ponto de partida e uma estrutura para obter essa experiência. Para tirar o máximo proveito do Mooc, sugiro usar um exemplo muito específico, digamos regressão logística, e realmente trabalhar com um conjunto de dados diferente, bônus duplo se você o fizer em um idioma diferente daquele em que o curso é ministrado .
neone4373
Essa é uma boa ideia. O que falta para as estatísticas em geral é um site de treinamento. Por exemplo, um conjunto de bancos de dados, juntamente com metas e possíveis resultados no final. Algo como khancademy, mas mais poderoso;)
Christian Sauer
11

Os programas de certificação que você mencionou são realmente cursos de nível básico. Pessoalmente, acho que esses certificados mostram apenas a persistência de pessoas e podem ser úteis apenas para quem está se candidatando a estágios, não para os trabalhos reais de ciência de dados.

Stanpol
fonte
Concordo. O material do curso é bom para você começar, mas é principalmente de nível de entrada.
Shagun Sodhani
10

Lidero equipes de ciência de dados para uma grande empresa de Internet e já selecionei centenas de perfis e entrevistei dezenas para nossas equipes em todo o mundo. Muitos candidatos foram aprovados nos cursos e programas mencionados acima ou trazem credenciais semelhantes. Pessoalmente, também participei dos cursos, alguns são bons, outros são decepcionantes, mas nenhum deles faz de você um "cientista de dados".

Em geral, eu concordo com os outros aqui. Um certificado da Coursera ou Cloudera apenas indica um interesse, mas não move a agulha. Há muito mais a considerar e você pode ter um impacto maior fornecendo um repositório abrangente de seu trabalho (perfil do github, por exemplo) e conectando-se a outros cientistas de dados. Qualquer pessoa que contrate um perfil de ciência de dados sempre prefere ver seu trabalho anterior e estilo / habilidades de codificação.

Rodrigo Rivera
fonte
8

Existem várias certificações em andamento, mas elas têm diferentes áreas de foco e estilo de ensino.

Eu prefiro o Analytics Edge no eDX muito mais do que a especialização de John Hopkins, pois é mais intenso e prático. A expectativa na especialização de John Hopkins é colocar de 3 a 4 horas por semana contra 11 a 12 horas por semana no Analytics Edge.

Do ponto de vista da indústria, tomo essas certificações como um sinal de interesse e não como nível de conhecimento que uma pessoa possui. Há muitos desistentes nesses MOOCs. Eu valorizo ​​muito mais outras experiências (como participar de competições Kaggle) do que passar pela certificação XYZ no MOOC.

Kunal
fonte
2
E o stats.SE, o datascience.SE. Você acha que eles podem dizer muito sobre o nível relevante de conhecimento?
IharS
O que os desistentes têm a ver com isso? Presumivelmente, a certificação depende da conclusão do curso, e não apenas do registro ...
Gala
Muitas pessoas mencionam que estão passando pela certificação fazendo um curso sobre esses MOOCs. Você precisa ter cuidado com isso.
Kunal
@Kunal Faz sentido, mas sua resposta passa da “certificação” para a “desistência” (que presumivelmente não tem certificação ). A chave aqui está passando . É um pouco como estar registrado como estudante ou ter uma conta Kaggle. Nada disso nos diz se você deve valorizar alguém que realmente se formou, concluir um curso ou participar de uma competição até o fim.
Gala
6

Não tenho certeza sobre a era da nuvem, mas um dos meus amigos se juntou ao John Hopkins e, em suas palavras, é "brilhante para você começar". Também foi recomendado por muitas pessoas. Estou planejando participar daqui a algumas semanas. No que diz respeito à seriedade, não acho que essas certificações o ajudarão a conseguir um emprego, mas certamente o ajudarão a aprender.

Pensu
fonte
4

@OP: Escolher respostas por votos é a PIOR idéia.

Sua pergunta se torna um concurso de popularidade. Você deve procurar a resposta certa, duvido que você saiba o que está perguntando, saiba o que está procurando.

Para responder à sua pergunta:
P: quão seriamente as certificações do DS são vistas neste momento pela comunidade.

A: Qual é o seu objetivo em fazer esses cursos? Para o trabalho, para a escola, para o auto-aperfeiçoamento, etc? As aulas do Coursera são muito aplicadas, você não aprenderá muita teoria, elas são intencionalmente reservadas para a sala de aula.

No entanto, as aulas do Coursera são muito úteis. Eu diria que é equivalente a um ano de aula de estatística, em um programa de mestrado de dois anos.

Ainda não tenho certeza do seu reconhecimento no setor, porque o problema de como você realmente fez o curso? Quanto tempo você gastou? É muito mais fácil obter notas A nesses cursos do que um exame de lápis e papel em sala de aula. Portanto, há uma enorme variação de qualidade de pessoa para pessoa.

user13985
fonte
Parte da questão visa avaliar se a comunidade valorizou ou não a certificação. Em algumas áreas, a certificação é uma necessidade absoluta. Em outros, a certificação não importa. Em outros, ainda, as certificações de uma determinada empresa são respeitadas e as certificações competitivas não. A outra parte foi feita para entender a diferença no foco tópico das certificações existentes. Data Science é um termo amplo. As certificações normalmente são mais focadas. Essa é uma pergunta ruim para o formato de controle de qualidade - é mais uma discussão, sujeita a opinião.
Steve Kallestad
Meu propósito ao observar que escolhi a resposta por votos era deixar claro que todas as respostas mereciam ser lidas. Todo mundo faz bons pontos, incluindo você aqui embaixo. Alguém que está se perguntando sobre essas coisas não deve se limitar às uma ou duas respostas principais.
Steve Kallestad
Votar para encontrar a resposta certa é uma ideia horrível. É a maneira errada de abordar a matemática. Você claramente perdeu o meu ponto.
user13985
2

Eu acho que o efeito da certificação do coursera depende do indivíduo e das classes. O requisito diz que de 3 a 5 horas por semana, se você colocar mais, e o material abrir por muito mais do que 3 a 5 horas, essas classes e certificações podem ser equivalentes a uma forte base de conhecimento e experiência no campo . A ciência chega para quem a solicita.

Neveen
fonte
2

Estou quase terminando a Johns Hopkins Data Science Specialization no Coursera (um curso e uma pedra angular para me formar). Vou apenas dar-lhe os prós e os contras, tentando mantê-lo o mais objetivo possível:

Prós :

  • Estrutura em torno do processo de aprendizagem
  • Você criará um portfólio ao longo do tempo

Contras :

  • Diferentes origens necessárias para diferentes cursos. Os primeiros cursos não assumem conhecimento prévio. De repente, não é fácil entender os cursos conceituais. (Inferência Estatística, Análise de Regressão)
  • Ministrado por 3 professores. Eu acho que eles não estão na mesma página sobre seu público potencial e suas habilidades / necessidades / interesses.
pbahr
fonte
2

A melhor maneira de obter sucesso no trabalho que você deseja que mostre que pode fazê-lo.

Os MOOCs que você mencionou fornecerão uma boa base no básico e deverão ser suficientes para você começar a resolver seus próprios problemas de aprendizado de máquina / ciência de dados. Tente uma ou duas competições da Kaggle, que é uma ótima maneira de melhorar suas habilidades, e uma nota decente será de interesse para um potencial empregador. Publique seus resultados no Github usando algo como um Notebook iPython, que permitirá que seu trabalho seja visto e julgado facilmente.

Tente uma análise de outros conjuntos de dados públicos, como o Conjunto de dados de compartilhamento de bicicleta da UCI ou o Conjunto de dados de tratamento de diabetes da UCI, que são muito divertidos de experimentar e mostre que você está interessado e disposto a desenvolver suas habilidades.

DrMcCleod
fonte
2

Depende realmente da credibilidade da instituição que concedeu o certificado. Por exemplo, a Certificação de Ciência de Dados de uma empresa sediada em Harvard é reconhecida por muitos parceiros do setor e pode fazer uma boa escolha. Você não disse que tipo de certificado está procurando?

Sumeet Nijjar
fonte
1

Valor para o aluno, saco misto. Pagar várias centenas de dólares por um programa ou cem dólares por um curso é um motivador.

Eu completei uma série, do MITx. É um curso de pesquisa e pós-graduação de métodos e ferramentas voltado para aqueles que precisam "conhecer" com mais detalhes. É aterramento suficiente, que me senti confortável aplicando o que aprendi.

Um curso autônomo da HarvardX sobre o método de gráfico acíclico direcionado era mais como um seminário de graduação em estatística sobre o método da Judea Pearl. Demoraria muito tempo até eu ouvir sobre isso, caso contrário.

A série HarvardX é um campo de treinamento de nível de pós-graduação que visa orientar o novo aluno para o conjunto de ferramentas e aplicativos R.

A série BerkeleyX é um curso de pesquisa de graduação que utiliza uma classe Python criada para fins específicos, que é quase uma linguagem específica de domínio.

Quanto ao valor dos certificados, só posso relatar que minha única experiência educacional relacionada era um mestrado em geofísica e eu tinha cerca de um ano de experiência paga fora da descrição de meu cargo (advogado sênior do banco).

Talvez como resultado dos certificados, eu tenha sido recusado como "superqualificado" por pelo menos dois trabalhos que conheço. Portanto, meu conselho é que, se você tiver um certificado, não o mencione se a palavra "Excel" aparecer no anúncio de emprego.

Richard Careaga
fonte
1

Alguns recursos no edX para cursos de ciência de dados da Harvard, MIT, Microsoft e outros que possam interessar a esse grupo.

Por exemplo, temos um programa de certificação profissional de Harvard que consiste em 8 cursos e um exame básico aqui .

Para estudos mais avançados, temos um programa MicroMasters do MIT aqui .

bem como um da UC San Diego aqui . Para uma ótima visão geral da Data Science, temos um programa da Microsoft. Para todos os nossos programas, você pode conferir aqui .

Espero que isto ajude,

Josh de edX

Josh Grossman
fonte