Imagem da VM para projetos de ciência de dados

24

Como existem inúmeras ferramentas disponíveis para tarefas de ciência de dados, é complicado instalar tudo e criar um sistema perfeito.

Existe uma imagem do Linux / Mac OS com Python, R e outras ferramentas de ciência de dados de código aberto instaladas e disponíveis para uso imediato das pessoas? Um Ubuntu ou um SO leve com a versão mais recente do Python, R (incluindo IDEs) e outras ferramentas de visualização de dados de código aberto instaladas será o ideal. Não encontrei um em minha pesquisa rápida no Google.

Informe-me se houver algum ou se alguém criou um para você? Presumo que algumas universidades possam ter suas próprias imagens de VM. Por favor, compartilhe esses links.

JeanVuda
fonte
Embora essa pergunta possa ser vista como offtopic de fronteira, de alguma forma acho uma boa pergunta para o site IMHO.
Sean Owen
3
Além dos comentários impressionantes, há um post (um pouco mais antigo) no blog que compara várias soluções diferentes: jeroenjanssens.com
2013

Respostas:

12

Se você estiver procurando por uma VM com várias ferramentas pré-instaladas, experimente a Data Science Toolbox .

Sean Owen
fonte
Projeto interessante (+1). Obrigado por compartilhar! Pode ser mais fácil usá-lo do que descobrir por que o Docker não queria trabalhar no meu laptop Win 7 (veja acima). No entanto, ainda pode ser uma boa ideia aprender o Docker, considerando as tendências recentes.
Aleksandr Blekh
Informações legais. Comparando com as ferramentas vm, é necessário algum tempo para entender como o docker opera. Se você já conhece a vm, é uma boa ideia usar esta caixa de ferramentas. Obrigado por compartilhar.
fansia
Obrigado por compartilhar. Definitivamente é interessante. Mas não vejo como alguém possa usá-lo sem uma interface gráfica. Eu precisaria do R-studio e do PyCharm para Python (o notebook iPython está lá). Vou precisar jogar um pouco para entender completamente.
JeanVuda 24/01
11
@AleksandrBlekh eu era capaz de finalmente chegar janela de encaixe ao trabalho na minha máquina Windows 7 regenerando os certificados docker-machine regenerate-certsEspero que ajude :)
RK
@RK: Obrigado por me avisar. Vou tentar quando tiver uma chance (pode demorar um pouco, porém, pois há questões de maior prioridade esperando para serem resolvidas).
Aleksandr Blekh
8

Embora as imagens do Docker agora estejam mais na moda, eu pessoalmente acho que a tecnologia do Docker não é amigável, mesmo para usuários avançados. Se você concorda com o uso de imagens de VM não locais e pode usar o Amazon Web Services (AWS) EC2 , considere imagens focadas em R para projetos de ciência de dados, pré-criados por Louis Aslett. As imagens contêm versões muito recentes, se não as mais recentes, do Ubuntu LTS , R e RStudio Server . Você pode acessá-los aqui .

Além dos componentes principais listados acima, as imagens contêm muitas ferramentas úteis de ciência de dados também. Por exemplo, as imagens suportam LaTeX, ODBC, OpenGL, Git, bibliotecas numéricas otimizadas e muito mais.

Aleksandr Blekh
fonte
Muito obrigado por mencionar esta opção. Definitivamente vou tentar. No entanto, quero uma imagem que tenha exatamente essa AMI, mas que possa ser executada com o VirtualBox no meu laptop.
JeanVuda
Eu assisti recentemente a um tutorial sobre o Docker, testei e achei fácil de entender. Qual parte você achou não amigável?
Robert Smith
@ JeanVids: De nada. Entendo o seu desejo de ter uma VM local - foi por isso que tentei o Docker no meu computador. Avisarei se encontrar uma imagem da VM do VirtualBox focada na ciência de dados (espero, baseada em R).
Aleksandr Blekh
11
@ RobertSmith: Eu entendo. Talvez, o problema foi que eu estava tentando configurá-lo na minha máquina Windows. De qualquer forma, tentarei algum tempo depois. Obrigado por seus comentários.
Aleksandr Blekh
11
@AleksandrBlekh Sim, esse pode ser o principal problema. Infelizmente, existem muitos problemas ao instalar esse tipo de coisa no Windows.
Robert Smith