Ciência de dados

13
OrientDB vs Neo4j vs Titan

Estou trabalhando em um projeto de ciência de dados relacionado à mineração de relacionamento social e preciso armazenar dados em alguns bancos de dados de gráficos. Inicialmente, escolhi o Neo4j como banco de dados. Mas parece que o Neo4j não escala bem. A alternativa que descobri são Titan e...

13
Dimensionalidade e Manifold

Uma frase comumente ouvida no aprendizado de máquina não supervisionado é Entradas de alta dimensão normalmente vivem em um coletor de baixa dimensão ou próximo a ela O que é uma dimensão? O que é uma variedade? Qual é a diferença? Você pode dar um exemplo para descrever os...

13
Sou programador, como entro no campo da ciência de dados?

Antes de tudo, esse termo parece tão obscuro. Enfim .. Eu sou um programador de software. Uma das linguagens que posso codificar é Python. Falando em dados, posso usar SQL e fazer raspagem de dados. O que descobri até agora depois de ler tantos artigos nos quais a Data Science é boa: 1-...