Recentemente, tive uma conversa com alguém e mencionei meu interesse na análise de dados e com quem pretendia aprender as habilidades e ferramentas necessárias. Eles me sugeriram que, embora seja ótimo aprender as ferramentas e desenvolver as habilidades, há pouco sentido em fazê-lo, a menos que eu tenha conhecimento especializado em um campo específico.
Eles basicamente resumiram que eu seria como um construtor com uma pilha de ferramentas que poderiam construir algumas caixas de madeira e que poderiam construir coisas melhores (cabines, armários etc.), mas sem o conhecimento de um campo específico eu nunca ser um construtor para quem um produto específico chegaria.
Alguém encontrou isso ou tem alguma opinião sobre o que fazer com isso? Parece que, se fosse verdade, seria preciso aprender os aspectos das ciências de dados e aprender um novo campo apenas para se tornar especializado.
Respostas:
Drew Conway publicou o Data Science Venn Diagram , com o qual concordo plenamente:
Por um lado, você realmente deve ler o post dele. Por outro lado, posso oferecer minha própria experiência: minha experiência no assunto (que eu gosto mais como termo do que "Experiência Substantiva", porque você também deve realmente ter "Experiência Substancial" em matemática / estatísticas e hackers) está no negócios de varejo, minhas estatísticas / matemática são previsões e estatísticas inferenciais, e minhas habilidades de hackers estão em R.
Desse ponto de vista, posso conversar e entender os varejistas, e alguém que não tenha pelo menos um conhecimento passageiro desse campo terá que enfrentar uma curva acentuada de aprendizado em um projeto com varejistas. Como um show paralelo, faço estatísticas em psicologia, e é exatamente o mesmo lá. E mesmo com algum conhecimento da parte de hackers / matemática / estatísticas do diagrama, eu teria dificuldade em me atualizar, digamos, na pontuação de crédito ou em algum outro novo campo de assunto.
Uma vez que você tem uma certa quantidade de matemática / stats e habilidades de hacker, é muito melhor para adquirir uma base em uma ou mais disciplinas do que em adicionar ainda uma outra linguagem de programação para suas habilidades de hacker, ou aindaoutro algoritmo de aprendizado de máquina para seu portfólio de matemática / estatísticas. Afinal, uma vez que você tenha uma sólida base em matemática / estatísticas / hackers, poderá, se necessário, aprender essas novas ferramentas da Web ou de livros em um período relativamente curto. Mas a experiência no assunto, por outro lado, provavelmente você não poderá aprender do zero se começar do zero. E os clientes preferem trabalhar com algum cientista de dados A que entende seu campo específico do que com outro cientista de dados B que primeiro precisa aprender o básico - mesmo que B seja melhor em matemática / estatísticas / hackers.
Claro, tudo isso também significa que você nunca se tornará um especialista em nenhum dos três campos. Mas tudo bem, porque você é um cientista de dados, não um programador, estatístico ou especialista no assunto. Sempre haverá pessoas nos três círculos separados com quem você poderá aprender. Que faz parte do que eu mais gosto em ciência de dados.
EDIT: Algum tempo e algumas reflexões depois, gostaria de atualizar este post com uma nova versão do diagrama. Ainda acho que as habilidades de hackers, conhecimentos de matemática e estatística e conhecimentos substanciais (abreviados para "Programação", "Estatística" e "Negócios" para legibilidade) são importantes ... mas acho que o papel da comunicação também é importante. Todas as informações que você obtém ao aproveitar seus conhecimentos sobre hackers, estatísticas e negócios não farão muita diferença, a menos que você possa comunicá-las a pessoas que podem não ter essa mistura única de conhecimento. Pode ser necessário explicar suas informações estatísticas a um gerente de negócios que precisa estar convencido de gastar dinheiro ou alterar processos. Ou para um programador que não pensa estatisticamente.
Então, aqui está o novo diagrama de Venn da ciência de dados, que também inclui a comunicação como um ingrediente indispensável. Eu rotulei as áreas de maneira a garantir o máximo de chamas, além de ser fácil de lembrar.
Comente.
Código R:
fonte
Certamente você pode. As empresas estão clamando por cientistas de dados. Tenha cuidado, porém, para que todos interpretem o termo de maneira diferente. Dependendo da empresa, você pode ser solicitado a fazer qualquer coisa, de estatísticas a escrever código de produção. Qualquer um deles é um trabalho de período integral e você deve estar preparado para os dois; portanto, pedir um profundo conhecimento especializado além do que não seja razoável, na minha opinião, e as empresas com as quais conversei enfatizaram as outras duas áreas ( especialmente a programação). No entanto, descobri que ajuda a estar familiarizado com os tipos de problemas que você pode enfrentar. Dependendo do setor, isso pode ser detecção de anomalias, recomendação / personalização, previsão, ligação de registros, etc. Essas são coisas que você pode aprender como exemplos ao mesmo tempo em que matemática e programação.
fonte