Existe um bom navegador / visualizador para ver um conjunto de dados R (arquivo .rda)

38

Quero procurar um arquivo .rda (conjunto de dados R). Eu sei sobre o View(datasetname)comando. O R.app padrão fornecido para o Mac não possui um navegador muito bom para dados (ele abre uma janela no X11). Eu gosto do navegador de dados do RStudio que é aberto com o Viewcomando No entanto, ele mostra apenas 1000 linhas e omite o restante. ( ATUALIZAÇÃO: o visualizador do RStudio agora mostra todas as linhas ) Existe um bom navegador que mostre todas as linhas no conjunto de dados e que você goste / use.

Curious2learn
fonte

Respostas:

22

Aqui estão algumas opções básicas, mas, como você, não posso dizer que estou totalmente feliz com meu sistema atual.

Evite usar o visualizador :

  • Ou seja, use as ferramentas de linha de comando para navegar pelos dados
  • heade tailpara mostrar linhas iniciais e finais
  • str para uma visão geral dos tipos de variáveis
  • dplyr::glimpse()para uma visão geral dos tipos de variáveis ​​de todas as colunas
  • ferramentas básicas de extração gostam [,1:5]de mostrar as cinco primeiras colunas
  • Use um pager para exibir e navegar pelos dados (por exemplo, page(foo, "print")) possivelmente em conjunto com algumas ferramentas de extração variável. Isso funciona muito bem no Linux, que usa less. Não tenho certeza de como isso acontece no Windows ou Mac.

Exportar para software de planilha :

Jeromy Anglim
fonte
(+1) na maioria das vezes eu também exporto para planilhas, algumas vezes edit(your_data_object)também é útil, mas não tenho certeza de limitações em linhas e colunas para esta função.
Dmitrij Celov
3
(+1) também. O Navegador de Dados no Stata não é perfeito, mas é uma das razões pelas quais inicio o Stata em vez do R (Studio) em muitas circunstâncias.
pe.
1
No re: seu segundo marcador, o RExcel supostamente torna a transmissão de dados entre o R e o Excel mais uniforme, embora esteja disponível apenas no Windows. Eu não tentei (não estou no Windows); Sou basicamente contente com write.csv :)
JMS
Jeremy Pager funciona bem no Mac.
chl
2
@ Curious2learn: você vai analisar seriamente 700 Mb de dados manualmente? A maioria das opções dadas por Jeromy ( head, tail, stretc.) deve ser suficiente. Se você quiser uma visão "maior" de seus dados ... traçá-lo ( plot, qqplot, histetc)
nico
26

Eu recomendo fortemente as ligações googleVis , R Package R à API de visualização do Google . Os autores do pacote são Markus Gesmann e Diego de Castillo.

O visualizador de quadros de dados no googleVis é surpreendentemente simples de usar.

Esses caras fizeram um ótimo trabalho porque o googleVis é fácil de usar, embora a API de visualização do Google não seja.

O googleVis está disponível no CRAN .

A função no googleVis para renderizar um quadro de dados como uma tabela HTML estilizada é gvisTable () .

Chamando essa função, passar um quadro de dados R renderiza os quadros de dados R como tabelas HTML interativas em um formulário com qualidade de painel e funcional.

Alguns recursos do googleVis / gvisTable que achei particularmente bons:

  • manter a capacidade de resposta à medida que o número de linhas aumenta, valores de parâmetros especificados pelo usuário para paginação (usando os botões de seta); se você não quiser paginação, poderá acessar as linhas fora da visualização por meio de uma barra de rolagem no lado direito da tabela, de acordo com os parâmetros especificados na chamada de função gvisTable ()

  • coluna-wise tipo clicando no cabeçalho da coluna

  • a chamada gvisTable retorna HTML, portanto é portátil e, embora eu não tenha usado esse recurso, toda a tabela pode ser estilizada da mesma maneira que qualquer tabela HTML, com CSS (primeiro designando classes para o seletor relevante)

Para usar, basta importar o pacote googleVis , chame gvisTable () que passa no seu quadro de dados e vincule esse resultado (que é um objeto gvis ) a uma variável; então chame plot nessa instância gvis :

library(googleVis)

gvt = gvisTable(DF)

plot(gvt)

Você também pode passar vários parâmetros, embora faça isso por meio de um único argumento para gvisTable, options , que é uma lista R, por exemplo,

gvt = gvisTable(DF, options=list(page='enable', height=300))

Obviamente, você pode usar seu próprio CSS para obter qualquer estilo refinado que desejar.

Quando a plotagem é chamada em um objeto gvis, uma janela do navegador será aberta e a tabela será carregada usando o Flash

:

doug
fonte
3
Isso não parece funcionar muito bem para conjuntos de dados moderados a grandes.
Zach
13

O RStudio (RStudio.org) possui um visualizador de quadro de dados embutido, muito bom. Felizmente, é somente leitura. O RStudio é muito fácil de instalar depois de instalar uma versão recente do R. Se você estiver usando o Linux, primeiro instale o pacote r-base.

Frank Harrell
fonte
2
Sim, eu gosto do visualizador no RStudio. No entanto, como eu disse na minha postagem, ele mostra apenas as primeiras 1000 linhas. Posso aumentar isso alterando alguma configuração. Tentei alterar o max.print, mas isso não afetou o visualizador de dados.
precisa
@ Curious2learm: você deve pedir-lhes para adicionar essa opção na versão seguinte rstudio em support.rstudio.org/help/discussions/suggestions Eles costumam responder dentro de 2 dias
RockScience
12

Aqui estão alguns outros pensamentos (embora eu esteja sempre relutante em deixar o Emacs):

  • Dedutor (com JGR ) permite visualizar um quadro de dados com uma visão combinada de variável / dados (à la SPSS).
  • Rcmdr de J Fox também oferece recursos de edição / visualização, embora em um ambiente X11.
  • O Poor Man Gui de J Verzani ( pmg ) permite apenas uma visualização rápida de data.frame e outros objetos R. Não sabe muito sobre os recursos da Rattle .

Abaixo estão duas capturas de tela ao visualizar um data.frame de 704 por 348 (carregado como um RData) com Deducer (superior) e Rcmdr (inferior).

insira a descrição da imagem aqui

insira a descrição da imagem aqui

chl
fonte
9

Você pode obter View()para exibir todos os seus dados no RStudio. O truque é que você precisa usar a sintaxe de comando utils::View(). (Para obter mais informações, consulte minha resposta no Stack Overflow aqui: R View () não exibe todas as colunas do quadro de dados .)

gung
fonte
Eu escrevi uma função simples usando a função utils :: View () que também me mostra os números das colunas e coloquei no [arquivo Rprofile.site] ( statmethods.net/interface/customizing.html ) para que a função seja carregada R startup. A melhor parte é que os números de linhas e nomes de colunas estão sempre visíveis. Aqui está o código para a função:view <- function(x){ numberColumns <- ncol(x) numbers <- seq(1, numberColumns) names <- names(x) names(x) <- paste0(numbers, "_", names) utils::View(x) }
elevendollar
3

Recentemente, comecei a manter os dados em um banco de dados sqlite, acessar o banco de dados diretamente do R usando o sqldf e exibir / editar com uma ferramenta de banco de dados chamada tksqlite

Outra opção é exportar os dados e visualizar / editar com o Google Refine

Karsten W.
fonte
Obrigado pela informação. Vou descobrir como exportar os dados para o Google Refine e ver se isso funciona bem.
precisa
1
Outra ferramenta muito puro para visualização ou edição de dados em bancos de dados SQLite é sqlitebrowser.org
Dominic Comtois
0

A datatablefunção do DTpacote cria tabelas HTML. Você pode ver bem tabelas amplas.

Edgar Santos
fonte