Doutorado em Matemática (Programação Não Linear) mudando para Ciência de Dados?

9

Eu sou Ph.D. em matemática aluno interessado em ingressar na indústria como cientista de dados após a graduação. Apresentarei brevemente alguns antecedentes sobre minha educação antes de fazer minha pergunta, para que seja melhor compreendida:

Curso de Matemática:

Isso tem sido principalmente em matemática pura: topologia, análise funcional, etc., mas também inclui outras mais aplicadas (nas quais me especializei para a dissertação): otimização convexa, programação não linear, análise numérica, programação linear, otimização multiobjetiva. Além disso, tenho agora 0 conhecimento de estatística inferencial, mas estou confiante na teoria das probabilidades.

Programação:

Acabei de fazer um curso de um ano no Bacharelado, mas era principalmente o Mathematica e algum Java, dos quais não me lembro de nada honestamente. Neste curso, o conteúdo não incluiu nada de estruturas de dados ou design e análise de algoritmos, nem sistemas de gerenciamento de bancos de dados. Também aprendi Matlab por conta própria para implementar algoritmos na tese de bacharel.

O histórico acima foi durante o programa de Bacharelado e Mestrado. Agora, durante o doutorado. No programa, descobri que o Machine Learning é a combinação perfeita (para mim) entre otimização não-linear, programação e aplicativos no mundo real, ou seja, é teoricamente interessante e orientado a aplicativos. Esta é a razão pela qual fiquei tão empolgado em ir para a indústria. Por isso, comecei a aprender coisas por conta própria (no meu pouco tempo livre) durante os últimos 3 anos.

Breve resumo das coisas aprendidas:

  • Python: Eu me sinto confortável implementando algoritmos de otimização, trabalho com blocos de anotações jupyter e a biblioteca numpy (na verdade, eu precisava fazer isso para a dissertação) e fazendo manipulações básicas de dados e tarefas de limpeza em pandas. Isso eu aprendi online, em uma plataforma chamada dataquest ( https://app.dataquest.io ). No entanto, acho que não tenho conhecimento suficiente para passar em uma entrevista em estruturas de dados e algoritmos (veja acima).

  • Aprendizado de máquina: Fiz um curso de mestrado no tópico da universidade (como estou na Alemanha, não temos cursos de doutorado, então isso foi tudo no meu tempo pessoal), o que eu realmente gostei. Os tópicos incluídos: k-NN, PCA, SVM, NN, etc.

  • Fazendo um curso em Bancos de Dados neste semestre, focado em SQL.

  • Tomando a especialização Deep Learning no Coursera neste semestre.

Por fim, quero dizer que me sinto totalmente capaz de aprender os tópicos. De fato, com o tempo pretendo fazer mais cursos de pós-graduação disponíveis on-line (por exemplo, Stanford CS231N, CS234 etc.) porque, na minha opinião, os cursos on-line podem não ser suficientemente rigorosos. Espero que, após a defesa, eu consiga me concentrar em tempo integral nisso.

Daí as perguntas:

  • Ainda posso ser contratado neste momento (quero dizer, depois de terminar este semestre com o conhecimento descrito acima)? Sinceramente, acho que não estou pronta, mas sinto-me confiante de que posso ficar decente em um ano.

  • Estou sendo ingênuo demais ao pensar que uma empresa me daria uma chance?

  • O que devo fazer para me tornar mais desejável?

John D
fonte
1
Quando me inscrevi no meu trabalho (na Alemanha), havia pelo menos duas empresas que consideravam apenas o conhecimento matemático. Eles não se importavam com mais nada. A programação seria um favor, mas eles têm programadores dedicados a converter o material que a maioria dos matemáticos e físicos trabalham em software.
Ben

Respostas:

4

Não discordo das outras respostas, mas aqui está uma perspectiva diferente que você deve ter em mente. Além disso, posso oferecer respostas para suas perguntas específicas como alguém que deixou a academia (matemática aplicada / CS) para ciência de dados.

Em suma, entender as necessidades subjacentes e os casos de uso de um problema de negócios é fundamental para qualquer projeto, portanto, desenvolver um forte senso comercial e habilidades de comunicação multifuncional é fundamental se você deseja obter o maior alcance em uma carreira em ciência de dados.

  • Ainda posso ser contratado neste momento (quero dizer, depois de terminar este semestre com o conhecimento descrito acima)? Sinceramente, acho que não estou pronta, mas sinto-me confiante de que posso ficar decente em um ano.
  • Estou sendo ingênuo demais ao pensar que uma empresa me daria uma chance?

Eu vou responder isso juntos. Depende fortemente da empresa e de suas necessidades atuais. Para você, isso pode variar de acordo com as dimensões "inicialização" para "empresa" e "ML shop" para "negócios gerais orientados a dados". Com o último, quero dizer que existem empresas cujo único objetivo é vender produtos ou serviços de ML a clientes, versus empresas gerais de tecnologia que desejam explorar a modelagem em seus negócios. Provavelmente, você encontrará um ajuste mais rápido / fácil com uma empresa que já possui seus casos de uso de ML criados ou ditados por outras pessoas, porque é provável que você não esteja preparado para criar estratégias para o início de um novo projeto.

Portanto, isso pode ser verdade para uma empresa maior que possui um departamento dedicado a analisar os detalhes técnicos do modelo de ML, enquanto outras partes da empresa determinam a estratégia e o design dos negócios, ou em uma empresa de qualquer tamanho focada na ML como seu produto / serviço.

No curto prazo, sim, você provavelmente pode convencer alguém a tê-lo como estagiário ou assistente em alguns projetos, mas seu doutorado provavelmente será visto como uma desvantagem em potencial se você estiver conversando com pequenas e médias empresas que desejam contratar generalistas / macacos de todos os comércios ...

  • O que devo fazer para me tornar mais desejável?

O que me leva a isso. Você pode escolher sua própria aventura, porque há muitos tipos de funções, mas você deve estar ciente de que tipo de situação e situação cada empregador em potencial está procurando e ser realista sobre como você pode se encaixar nela. Existem muitos empregadores que não expressam claramente o que querem ou precisam, ou nem sabem a si mesmos o que é isso . Você faria bem em descobrir isso com eles para evitar decepções pesadas.

Se você deseja ampliar seus horizontes na ciência de dados e garantir que você tenha o maior impacto nos negócios e oportunidades de desenvolvimento profissional, gostaria de aprender muito mais sobre os aplicativos de negócios da ciência de dados. Essas são altamente diversas e, na prática, são mais informais e mais impactantes para os negócios do que se preocupar com otimizações para matrizes pseudo-inversoras.

Apesar das opiniões razoáveis ​​nas outras respostas postadas sobre o mercado, na minha opinião , existe um enorme déficit de mercado para os cientistas de dados que:

  • Compreenda verdadeiramente as necessidades dos negócios e possa se comunicar de maneira eficaz com pessoas não técnicas
  • Desenvolva e execute planos que envolvam solução geral de problemas orientados a dados, que podem ou não envolver a construção de modelos "legais" (e francamente eles provavelmente não o farão, pelo menos não até que o problema seja muito bem compreendido pelos métodos exploratórios mais tradicionais).
RHC
fonte
Resposta muito boa
pcko1
Eu (novo mestrado em matemática) acredito que estou no barco oposto ao OP. Um pouco de programação lá, um pouco de matemática aqui, mas nada muito profundo em qualquer lugar. Minha educação é muito geral, por isso é difícil se destacar. Eu tenho amplas habilidades pessoais, como você mencionou na penúltima penalidade. Depois de entender completamente um conceito técnico, sou bastante bom em explicá-lo aos leigos. Eu também era oficial da marinha, por isso tenho muita experiência trabalhando com pessoas e projetando uma "imagem", que acho que passa para uma mentalidade de negócios.
rocksNwaves
10

Os trabalhos de ciência de dados abrangem uma ampla gama de atividades diferentes; portanto, qualquer resposta provavelmente será subjetiva. Como estou no meio acadêmico, meu conhecimento do mercado de trabalho é limitado, mas pelo que posso ver:

  • O contexto atual é muito favorável aos cientistas de dados que procuram emprego, portanto, qualquer pessoa com algum conhecimento básico de ML tem uma chance. Você já está acima desse nível, então não se preocupe com essa imho frontal. É provável que a tendência continue assim, mas ninguém sabe o futuro.
  • Idealmente, para aumentar suas chances, você deve demonstrar que possui alguma experiência prática: por exemplo, projetos no github, participação em uma competição de ML, esse tipo de coisa.
  • Não negligencie seu doutorado em matemática: você parece ter muito tempo livre para aprender ciência de dados, bom para você ... Mas certifique-se de que o doutorado seja sua principal prioridade, será um grande trunfo em seu currículo, mesmo que não está relacionado à ciência de dados.
Erwan
fonte
3

Erwan acertou em cheio (+1). Mas acho que minha adição é um pouco longa para um comentário.

Você parece estar bem à frente de onde eu estava quando consegui meu emprego no DS. Eu estava em matemática pura, fiz dois pós-doutorados e tive pouco tempo de auto-estudo quando estava me candidatando à ciência de dados do setor.

Por outro lado, eu fiz exames atuariais na minha graduação, o que provavelmente me ajudou a entrar no espaço da fintech. Ao se inscrever, enfatize o que você já sabe e reconheça o que precisará aprender nos primeiros meses (programação mais forte? Usando git? ...).

(Além disso, você não mencionou modelos baseados em árvore no seu curso de ML: eu acho que isso foi apenas uma omissão, mas esses parecem ser o modelo mais importante a ser entendido, a menos que você esteja tentando entrar em setores onde as redes neurais são a norma.)

Ben Reiniger
fonte
Obrigado pela resposta! É bom saber que não é a primeira vez que um matemático puro vai para a ciência de dados.
John D
Posso perguntar qual a sua opinião sobre cursos on-line, como a especialização Deep Learning no Coursera? Esse tipo de curso realmente o prepara para trabalhar na indústria?
John D
Em vez de frequentar os Coresera, experimente os cursos com rapidez. use essas ferramentas aprendidas nos aplicativos necessários. Só não pense demais, apenas entre e garanto que você encontrará sua paixão.
Khwaja wisal
3

Apenas não aceite este conselho cegamente: os assuntos que você mencionou em matemática são fundamentais para resolver problemas usando aprendizado de máquina / aprendizado profundo, a programação é uma ferramenta para implementar toda essa teoria que você aprende e, com base nisso, cria suas hipóteses e depois Para implementá-lo no código, para que você não precise das habilidades de codificação de um codificador, deve conhecer as estruturas de dados de seu uso, especialmente os quadros de dados e a manipulação de tensores e o descanso que aprenderá durante a implementação. A melhor parte é que você tem o conhecimento básico de matemática (suponho que você saiba cálculo multivariado de estatística de probabilidade, análise funcional e o restante das disciplinas que você mencionou, não entrarei em detalhes, pois você já está fazendo um doutorado .

Eu sugiro que você participe de todos os cursos do Fast.ai ministrados por Jeremy Howard (ele é literalmente deus do aprendizado profundo). Seu curso de aprendizado profundo prático para codificadores está repleto de conhecimento, além do conhecimento básico da matemática por trás das redes neurais. você pode ler um blog de Michael Nielsen chamado neuralnetworksanddeeplearning.com. Na verdade, é um livro excelente, e você vai adorar a explicação matemática e, para obter mais compreensão, sempre pode ler o blog de Chris olah.

Então agora o problema é que você ainda pode obter muitos estágios de pesquisa e aprender lá em um ambiente industrial, mas eu prefiro sugerir que você se dedique algum tempo a percorrer esses cursos para entender o assunto e com a matemática por trás de você. estão prontos para fazer qualquer coisa. Veja, agora, a ciência de dados é como todo mundo quer ser um e apenas recebe esse salário de 6 dígitos e está pronto, mas não é que a ciência de dados não seja algo que você possa aprender de uma vez, mas leva tempo,

Portanto, reserve um tempo para ser paciente e continue resolvendo, continue lendo artigos sobre os tópicos mais recentes que agora são disponibilizados gratuitamente agora, então continue.

khwaja wisal
fonte
obrigado pela resposta! vai fazer.
John D