Eu sou Ph.D. em matemática aluno interessado em ingressar na indústria como cientista de dados após a graduação. Apresentarei brevemente alguns antecedentes sobre minha educação antes de fazer minha pergunta, para que seja melhor compreendida:
Curso de Matemática:
Isso tem sido principalmente em matemática pura: topologia, análise funcional, etc., mas também inclui outras mais aplicadas (nas quais me especializei para a dissertação): otimização convexa, programação não linear, análise numérica, programação linear, otimização multiobjetiva. Além disso, tenho agora 0 conhecimento de estatística inferencial, mas estou confiante na teoria das probabilidades.
Programação:
Acabei de fazer um curso de um ano no Bacharelado, mas era principalmente o Mathematica e algum Java, dos quais não me lembro de nada honestamente. Neste curso, o conteúdo não incluiu nada de estruturas de dados ou design e análise de algoritmos, nem sistemas de gerenciamento de bancos de dados. Também aprendi Matlab por conta própria para implementar algoritmos na tese de bacharel.
O histórico acima foi durante o programa de Bacharelado e Mestrado. Agora, durante o doutorado. No programa, descobri que o Machine Learning é a combinação perfeita (para mim) entre otimização não-linear, programação e aplicativos no mundo real, ou seja, é teoricamente interessante e orientado a aplicativos. Esta é a razão pela qual fiquei tão empolgado em ir para a indústria. Por isso, comecei a aprender coisas por conta própria (no meu pouco tempo livre) durante os últimos 3 anos.
Breve resumo das coisas aprendidas:
Python: Eu me sinto confortável implementando algoritmos de otimização, trabalho com blocos de anotações jupyter e a biblioteca numpy (na verdade, eu precisava fazer isso para a dissertação) e fazendo manipulações básicas de dados e tarefas de limpeza em pandas. Isso eu aprendi online, em uma plataforma chamada dataquest ( https://app.dataquest.io ). No entanto, acho que não tenho conhecimento suficiente para passar em uma entrevista em estruturas de dados e algoritmos (veja acima).
Aprendizado de máquina: Fiz um curso de mestrado no tópico da universidade (como estou na Alemanha, não temos cursos de doutorado, então isso foi tudo no meu tempo pessoal), o que eu realmente gostei. Os tópicos incluídos: k-NN, PCA, SVM, NN, etc.
Fazendo um curso em Bancos de Dados neste semestre, focado em SQL.
Tomando a especialização Deep Learning no Coursera neste semestre.
Por fim, quero dizer que me sinto totalmente capaz de aprender os tópicos. De fato, com o tempo pretendo fazer mais cursos de pós-graduação disponíveis on-line (por exemplo, Stanford CS231N, CS234 etc.) porque, na minha opinião, os cursos on-line podem não ser suficientemente rigorosos. Espero que, após a defesa, eu consiga me concentrar em tempo integral nisso.
Daí as perguntas:
Ainda posso ser contratado neste momento (quero dizer, depois de terminar este semestre com o conhecimento descrito acima)? Sinceramente, acho que não estou pronta, mas sinto-me confiante de que posso ficar decente em um ano.
Estou sendo ingênuo demais ao pensar que uma empresa me daria uma chance?
O que devo fazer para me tornar mais desejável?
Respostas:
Não discordo das outras respostas, mas aqui está uma perspectiva diferente que você deve ter em mente. Além disso, posso oferecer respostas para suas perguntas específicas como alguém que deixou a academia (matemática aplicada / CS) para ciência de dados.
Em suma, entender as necessidades subjacentes e os casos de uso de um problema de negócios é fundamental para qualquer projeto, portanto, desenvolver um forte senso comercial e habilidades de comunicação multifuncional é fundamental se você deseja obter o maior alcance em uma carreira em ciência de dados.
Eu vou responder isso juntos. Depende fortemente da empresa e de suas necessidades atuais. Para você, isso pode variar de acordo com as dimensões "inicialização" para "empresa" e "ML shop" para "negócios gerais orientados a dados". Com o último, quero dizer que existem empresas cujo único objetivo é vender produtos ou serviços de ML a clientes, versus empresas gerais de tecnologia que desejam explorar a modelagem em seus negócios. Provavelmente, você encontrará um ajuste mais rápido / fácil com uma empresa que já possui seus casos de uso de ML criados ou ditados por outras pessoas, porque é provável que você não esteja preparado para criar estratégias para o início de um novo projeto.
Portanto, isso pode ser verdade para uma empresa maior que possui um departamento dedicado a analisar os detalhes técnicos do modelo de ML, enquanto outras partes da empresa determinam a estratégia e o design dos negócios, ou em uma empresa de qualquer tamanho focada na ML como seu produto / serviço.
No curto prazo, sim, você provavelmente pode convencer alguém a tê-lo como estagiário ou assistente em alguns projetos, mas seu doutorado provavelmente será visto como uma desvantagem em potencial se você estiver conversando com pequenas e médias empresas que desejam contratar generalistas / macacos de todos os comércios ...
O que me leva a isso. Você pode escolher sua própria aventura, porque há muitos tipos de funções, mas você deve estar ciente de que tipo de situação e situação cada empregador em potencial está procurando e ser realista sobre como você pode se encaixar nela. Existem muitos empregadores que não expressam claramente o que querem ou precisam, ou nem sabem a si mesmos o que é isso . Você faria bem em descobrir isso com eles para evitar decepções pesadas.
Se você deseja ampliar seus horizontes na ciência de dados e garantir que você tenha o maior impacto nos negócios e oportunidades de desenvolvimento profissional, gostaria de aprender muito mais sobre os aplicativos de negócios da ciência de dados. Essas são altamente diversas e, na prática, são mais informais e mais impactantes para os negócios do que se preocupar com otimizações para matrizes pseudo-inversoras.
Apesar das opiniões razoáveis nas outras respostas postadas sobre o mercado, na minha opinião , existe um enorme déficit de mercado para os cientistas de dados que:
fonte
Os trabalhos de ciência de dados abrangem uma ampla gama de atividades diferentes; portanto, qualquer resposta provavelmente será subjetiva. Como estou no meio acadêmico, meu conhecimento do mercado de trabalho é limitado, mas pelo que posso ver:
fonte
Erwan acertou em cheio (+1). Mas acho que minha adição é um pouco longa para um comentário.
Você parece estar bem à frente de onde eu estava quando consegui meu emprego no DS. Eu estava em matemática pura, fiz dois pós-doutorados e tive pouco tempo de auto-estudo quando estava me candidatando à ciência de dados do setor.
Por outro lado, eu fiz exames atuariais na minha graduação, o que provavelmente me ajudou a entrar no espaço da fintech. Ao se inscrever, enfatize o que você já sabe e reconheça o que precisará aprender nos primeiros meses (programação mais forte? Usando git? ...).
(Além disso, você não mencionou modelos baseados em árvore no seu curso de ML: eu acho que isso foi apenas uma omissão, mas esses parecem ser o modelo mais importante a ser entendido, a menos que você esteja tentando entrar em setores onde as redes neurais são a norma.)
fonte
Apenas não aceite este conselho cegamente: os assuntos que você mencionou em matemática são fundamentais para resolver problemas usando aprendizado de máquina / aprendizado profundo, a programação é uma ferramenta para implementar toda essa teoria que você aprende e, com base nisso, cria suas hipóteses e depois Para implementá-lo no código, para que você não precise das habilidades de codificação de um codificador, deve conhecer as estruturas de dados de seu uso, especialmente os quadros de dados e a manipulação de tensores e o descanso que aprenderá durante a implementação. A melhor parte é que você tem o conhecimento básico de matemática (suponho que você saiba cálculo multivariado de estatística de probabilidade, análise funcional e o restante das disciplinas que você mencionou, não entrarei em detalhes, pois você já está fazendo um doutorado .
Eu sugiro que você participe de todos os cursos do Fast.ai ministrados por Jeremy Howard (ele é literalmente deus do aprendizado profundo). Seu curso de aprendizado profundo prático para codificadores está repleto de conhecimento, além do conhecimento básico da matemática por trás das redes neurais. você pode ler um blog de Michael Nielsen chamado neuralnetworksanddeeplearning.com. Na verdade, é um livro excelente, e você vai adorar a explicação matemática e, para obter mais compreensão, sempre pode ler o blog de Chris olah.
Então agora o problema é que você ainda pode obter muitos estágios de pesquisa e aprender lá em um ambiente industrial, mas eu prefiro sugerir que você se dedique algum tempo a percorrer esses cursos para entender o assunto e com a matemática por trás de você. estão prontos para fazer qualquer coisa. Veja, agora, a ciência de dados é como todo mundo quer ser um e apenas recebe esse salário de 6 dígitos e está pronto, mas não é que a ciência de dados não seja algo que você possa aprender de uma vez, mas leva tempo,
Portanto, reserve um tempo para ser paciente e continue resolvendo, continue lendo artigos sobre os tópicos mais recentes que agora são disponibilizados gratuitamente agora, então continue.
fonte