Opções de hospedagem para dados publicamente disponíveis

12

Então, você decidiu apoiar a ideia de pesquisa reproduzível e deseja disponibilizar seus dados on-line para que as pessoas vejam e usem. A questão é: onde você o hospeda?

Minha primeira inclinação é, obviamente, o espaço da web privado que tenho em um servidor universitário, mas essas coisas não são tão persistentes - se eu sair, o diretório permanecerá aberto por um período muito curto de tempo antes de desaparecer. Dificilmente a configuração certa para manter os dados disponíveis para as pessoas usarem e trabalharem no futuro.

Você usa algo como GitHub ou SourceForge? Ou outro serviço?

Os dados em questão são o resultado de algumas simulações de interesse muito restrito - portanto, não acho necessariamente que um local como o InfoChimps ou outro repositório público de dados seja o local certo para isso. Isso é menos "Você pode aprender coisas com este código!" e mais "Você pode replicar a Figura 3 neste documento".

Fomite
fonte
1
Relevante, talvez duplicado: stats.stackexchange.com/questions/10045/…
Matt Parker
1
Absolutamente relevante - adicionando alguns detalhes que sugerem por que eu não achei que fosse uma duplicata.
Fomite 02/11
@EpiGrad: Que tipo de data você tem em mente? Se for um código-fonte relacionado ao seu projeto de pesquisa, você poderá anexá-lo à sua pré-impressão do arXiv .
Piotr Migdal #
@PiotrMigdal Idealmente, eu gostaria que os dados pudessem ficar por vários anos, tempo suficiente para que a propagação usual de citações em papel etc. funcionasse. Eu o anexaria a uma pré-impressão do arXiv, se apenas o meu campo a usasse;)
Fomite
@EpiGrad Então talvez um bom lugar para pesquisar seja o Open Data como um aspecto da Open Science - michaelnielsen.org/blog/open-science .
Piotr Migdal

Respostas:

4

Uma opção simples é o github .

Eu o uso um pouco para compartilhar dados e código de análise de dados. Alguns bons exemplos de outras pessoas que compartilham código e dados no site estão listados nesta pergunta .

Benefícios do github

  • Fácil de carregar depois de se familiarizar com o git e por que não usar o git para suas necessidades de controle de versão.
  • Você pode usar gists para arquivos únicos simples
  • É fácil para outras pessoas baixar arquivos únicos ou múltiplos como um arquivo morto
  • Possui uma boa quantidade de armazenamento gratuito
  • o código fonte pode ser navegado na internet
  • e mais...

Obviamente, o github não é perfeito para dados. Eu posso ver o mérito de usar um repositório institucional mais permanente ou alguma outra ferramenta dedicada para arquivamentos mais sérios.

Jeromy Anglim
fonte
1
Esta é realmente a solução que eu usei. Parte do problema com um repositório institucional é que a instituição em que estou está em fluxo e os dados não são realmente importantes o suficiente para um dos grandes data warehouses.
fomite
4

Outra opção parece ser o Dataverse , disponível como serviço e como software de código aberto. Eu não tentei, no entanto.

Karsten W.
fonte
2

Uma possibilidade para os acadêmicos é o uso de um repositório digital do campus, muitas vezes hospedado pelas bibliotecas do campus (para mim, um locus lógico para conjuntos de dados que acompanham as publicações).

Um repositório digital popular (gratuito) é o DSpace que, no meu entender, pode hospedar conjuntos de dados. Mas este é um serviço que alguém da sua instituição deve hospedar.

MannyG
fonte