Quem seguir no github para aprender sobre as melhores práticas em análise de dados?

28

É útil estudar o código de análise de dados de especialistas. Recentemente, estive lendo o github e há várias pessoas compartilhando código de análise de dados por lá. Isso inclui alguns pacotes R (que obviamente estão disponíveis diretamente no CRAN), mas também vários exemplos de pesquisa reproduzível, principalmente usando o R ( veja esta lista R no github ).

  • Quem são as pessoas boas para seguir no github para aprender sobre as melhores práticas em análise de dados?
  • Opcionalmente, que tipo de código eles compartilham e por que isso é útil?
Jeromy Anglim
fonte

Respostas:

18

Hadley Wickham . Ele tem vários projetos exploratórios de análise de dados no Github que você pode ver (por exemplo, "data-baby-names") e, dada a grandiosidade de ggplot2 / plyr / reshape, tenho uma confiança padrão (mas reconhecidamente cega) no seu melhor práticas, particularmente no que diz respeito aos seus próprios pacotes.

Além disso, você começa cedo em outros projetos nos quais ele está trabalhando!

raegtin
fonte
5
(+1) Ele também está trabalhando em um conjunto de tutoriais sobre desenvolvimento Advanced R , muito útil!
chl
@ Jeromy De fato, parece que essa é apenas uma maneira de redigir seu futuro livro didático (verifique os tweets anteriores de HW).
chl
9

Eu também sigo o repositório GitHub de John Myles White . Existem vários projetos orientados a dados, mas também coisas interessantes para desenvolvedores de R:

  • ProjectTemplate , um sistema de gabaritos para a construção de projetos R;
  • log4r , um sistema de registro.
chl
fonte