Eu sou um R noob que é obrigado a fazer vários tipos de análise em grandes conjuntos de dados em R. Então, enquanto olhava este site e outros lugares, me pareceu que há muitos problemas esotéricos e menos conhecidos envolvidos aqui - como qual pacote usar quando, quais transformações (não) se aplicam aos dados etc.
Só estou me perguntando se existe um livro / tutorial / guia que desmistifica tudo isso e apresenta as informações de maneira sistemática? Prefiro fazer isso em vez de olhar em volta e coletar informações de diferentes fontes online.
Desde já, obrigado.
r
large-data
TeachMeR
fonte
fonte
Respostas:
Aqui estão algumas postagens de blog que fiz sobre o assunto Large Data Sets with R. Existem alguns pacotes, como ff e bigmemory, que fazem uso da troca de arquivos e da alocação de memória. Alguns outros pacotes fazem uso da conectividade com bancos de dados como sqldf, RMySQL e RSQLite.
R Referências para manipulação de Big Data
Regressão logística de Big Data em R com ODBC
fonte