Manipulando grandes conjuntos de dados em R - tutoriais, práticas recomendadas etc.

11

Eu sou um R noob que é obrigado a fazer vários tipos de análise em grandes conjuntos de dados em R. Então, enquanto olhava este site e outros lugares, me pareceu que há muitos problemas esotéricos e menos conhecidos envolvidos aqui - como qual pacote usar quando, quais transformações (não) se aplicam aos dados etc.

Só estou me perguntando se existe um livro / tutorial / guia que desmistifica tudo isso e apresenta as informações de maneira sistemática? Prefiro fazer isso em vez de olhar em volta e coletar informações de diferentes fontes online.

Desde já, obrigado.

TeachMeR
fonte
2
Isso pode ser um começo: cran.r-project.org/web/views/HighPerformanceComputing.html
Roman Luštrik
1
Pode ajudar a compartilhar alguns exemplos de que tipo de análise você deseja fazer e como são os seus dados. Estatísticas simples, como médias ou regressões complexas? 200 variáveis ​​em mil linhas, ou 4 variáveis ​​e 20 milhões de linhas?
PaulHurleyuk 9/09/11
1
Se você tem realmente "grandes" conjuntos de dados, talvez deva dar uma olhada nos bancos de dados relacionais. Um ponto de partida para isso pode ser o manual "Importação / Exportação de Dados R" enviado com a RNB. O manual também está disponível na seção "Manuais" do site da R.
1
Primeiro, uma pergunta importante: o que você quer dizer com amplo e o que você quer fazer?
Fomite

Respostas: