Quais pacotes R você considera mais úteis no seu trabalho diário?

28

Encadeamento duplicado: Acabei de instalar a versão mais recente do R. Quais pacotes devo obter?

Quais são os pacotes R que você não imaginava seu trabalho diário com dados? Por favor, liste as ferramentas gerais e específicas.

ATUALIZAÇÃO: Quanto a 24.10.10 ggplot2parece ser o vencedor com 7 votos.

Outros pacotes mencionados mais de um são:

  • plyr - 4
  • RODBC, RMySQL- 4
  • sqldf - 3
  • lattice - 2
  • zoo - 2
  • Hmisc/rms - 2
  • Rcurl - 2
  • XML - 2

Obrigado a todos por suas respostas!

radek
fonte
1
Pergunta muito subjetiva: esta pergunta não pode ser respondida e não é adequada para um site de controle de qualidade.
Egon Willighagen
3
Provavelmente deve ser um wiki da comunidade; pergunta útil aqui, mas não tem resposta definitiva.
Shane
2
@ Shane: bom ponto. se mudou. @ Egon: subjetivo de fato. mas se as respostas vierem de pessoas conhecedoras, não me importo com a dose de subjetividade. Comecei a aprender R recentemente e tenho algumas dezenas instaladas para explorar, no entanto, percebo que existem ferramentas que eu uso com muito mais frequência, independentemente da tarefa em questão.
Radek
Seria interessante se o StackExchange pudesse oferecer suporte a algum método de vinculação de postagens de wiki da comunidade entre sites. Porque aposto que essa pergunta foi feita no Stackoverflow e também acho que a Análise Estatística pode atrair algumas pessoas que normalmente não visitam o SO.
Sharpie
@ Sharpie: houve várias postagens interessantes de SO, como stackoverflow.com/questions/1295955/… ou stackoverflow.com/questions/1535021/…, mas elas não estão focadas nos pacotes. e eu concordo, a ligação do wiki da comunidade pode ser realmente útil.
Radek

Respostas:

23

Eu uso o plyr e o ggplot2 mais diariamente.

Eu também confio muito em pacotes de séries temporais; mais especialmente, o pacote do zoológico .

Shane
fonte
8

Eu uso o pacote xtable . O pacote xtable transforma tabelas produzidas por R (em particular, as tabelas que exibem os resultados da anova) em tabelas LaTeX, para serem incluídas em um artigo.

Mehper C. Palavuzlar
fonte
8

multicore é bastante bom para ferramenta para tornar scripts mais rápidos mais rapidamente.
cacheSweave economiza muito tempo ao usar Sweave.

user88
fonte
8

ggplot2 - melhor visualização de mãos para R.

RMySQL / RSQLite / RODBC - para conectar-se a um banco de dados

sqldf - manipula data.frames com consultas SQL

Hmisc / rms - pacotes de Frank Harrell contendo diversas funções convenientes e boas funções para análises de regressão.

GenABEL - bom pacote para estudos de associação em todo o genoma

Rcmdr - uma GUI decente para R, se você precisar de uma.

Verifique também CRANtastic - este link possui uma lista dos pacotes R mais populares. Muitos no topo da lista já foram mencionados

Stephen Turner
fonte
8

data.table é o meu favorito agora! Aguardamos ansiosamente a nova versão com a lista de desejos mais implementada.

Branson
fonte
6

Para mim, pessoalmente, eu uso os três pacotes a seguir, todos disponíveis no incrível Projeto Omega para Computação Estatística (não pretendo ser um especialista, mas, para meus propósitos, são muito fáceis de usar):

  • RCurl : Ele tem muitas opções que permitem acessar sites que as funções padrão na base R teriam dificuldade, acho justo dizer. É uma interface R para a biblioteca libcurl, que possui o benefício adicional de toda uma comunidade fora do R desenvolvê-la. Também disponível no CRAN .

  • XML : perdoa muito a análise de XML / HTML malformado. É uma interface R para a biblioteca libxml2 e, novamente, possui o benefício adicional de toda uma comunidade fora do R, desenvolvendo-a. Também disponível no CRAN .

  • RJSONIO : Permite analisar o texto retornado de uma chamada json e organizá-lo em uma estrutura de lista para análise posterior. O concorrente deste pacote é rjson, mas este tem a vantagem de ser vetorizado, facilmente extensível através do S3 / S4, rapidamente e escalável para grandes dados.
Tony Breyal
fonte
6

Sweave permite incorporar código R em um documento LaTeX. Os resultados da execução do código e, opcionalmente, o código fonte, tornam-se parte do documento final.

Portanto, em vez de, por exemplo, colar uma imagem produzida por R em um arquivo LaTeX, você pode colar o código R no arquivo e manter tudo em um só lugar.

John D. Cook
fonte
4
Apenas uma dica para todos aqueles que desejam começar uma pesquisa reproduzível com R. Eu aconselho você a dar uma olhada no pacote novo em knitrvez de Sweave. É basicamente Sweave em esteróides. É tão fácil, se não mais fácil, aprender e muito mais flexível.
Christoph_J
4

zoo e xts são uma obrigação no meu trabalho!

Dr G
fonte
4

Acho a estrutura, juntamente com o livro complementar "Lattice: Visualização de Dados Multivariada com R", de Deepayan Sarkar, de valor inestimável.

NPE
fonte
4

Se você estiver fazendo algum tipo de modelagem preditiva, o sinal de intercalação é uma dádiva de Deus. Especialmente combinado com o pacote multicore , algumas coisas surpreendentes são possíveis.

Zach
fonte
4

No dia-a-dia, o pacote mais útil deve ser "estrangeiro", que possui funções para ler e gravar dados para outros pacotes estatísticos, como Stata, SPSS, Minitab, SAS, etc. Trabalhar em um campo em que R não é tão comum significa que isso é um pacote muito importante.

Graham Cookson
fonte
3

eu uso

car, doBy, Epi, ggplot2, gregmisc (gdata, gmodels, gplots, gtools), Hmisc, plyr, RCurl, RDCOMClient, remodelar, RODBC, TeachingDemos, XML.

muito.

esco
fonte
3

Eu não poderia viver sem:

  • estrutura para gráficos
  • xlsx ou XLConnect para ler arquivos do Excel
  • rtf para criar relatórios no formato rtf (eu preferiria o Sword ou o R2wd, mas não consigo instalar o statconn no trabalho; certamente tentarei o odfWeave em breve.)
  • nlme e lme4 para modelos mistos
  • ff para trabalhar com matrizes grandes
Stéphane Laurent
fonte
2

RODBC para acessar dados de bancos de dados, sqldf para executar consultas SQL simples em quadros de dados (embora eu esteja me forçando a usar comandos R nativos) e ggplot2 e plyr

wahalulu
fonte
2

Trabalho com R e MATLAB e uso muito o R.matlab para transferir dados entre os dois.

Peter Mortensen
fonte
2

Nós usamos principalmente:

  • ggplot - para gráficos
  • Estatísticas
  • e1071 - para SVMs
mohans
fonte
Você também pode querer verificar o kernlab e o sinal de intercalação para SVMs. São alternativas interessantes (não necessariamente melhores).
Zach
2

treliça, carro, massa, estrangeiros, festa.

Peter Flom - Restabelecer Monica
fonte
2

Para mim, estou usando o kernlab para o Machine Learning Lab baseado em Kernel e o e1071 para SVM e ggplot2 para gráficos

404Dreamer_ML
fonte
2

Eu uso ggplot2, vegan e remodelar com bastante frequência.

EDi
fonte
2

Eu gosto do roxygen por sua função Curry ().

charles.y.zheng
fonte
2

O RColorBrewer não foi mencionado aqui, eu o uso frequentemente para plotagem se eu precisar de esquemas de cores

Arne Jonas Warnke
fonte
2

Sou um grande fã do RCPP quando preciso de um loop for rápido ou para executar tratamentos não muito compatíveis com R. É muito bem implementado no sistema R eco, pode receber Matriz / Matriz esparsa sem conversão como argumentos em uma função.

A sintaxe do C ++ é fácil quando você está fazendo coisas simples (o que geralmente é o meu caso).

Realmente, você não precisa ser um fabricante de pacotes para precisar desta incrível lib.

Eu disse que o C ++ é muito rápido?

pommedeterresautee
fonte
2

Os pacotes doParallel e foreach tornaram minha vida muito mais fácil, permitindo-me paralelizar meu código e executá-lo em uma instância de computação otimizada no Amazon EC2 ! Eu os uso com muita frequência. Mas isso não seria possível sem as AMIs do RStudio lançadas por Louis Aslett. Finalmente, tenho que mencionar o pacote stringr que realmente torna o trabalho com cordas um passeio no parque. Use-o em todos os aplicativos de mineração de texto. E também uso o knitr com muita frequência para produzir relatórios de alta qualidade do meu trabalho. Muito obrigado por este incrível pacote Yihui Xie!

Antoine
fonte
1

Eu uso ggplot2, remodelar, retículo, knitr com mais frequência.

Jdbaba
fonte