Por favor, alguém pode me ajudar sobre a melhor maneira de importar um arquivo excel 2007 (.xlsx) para R. Eu tentei vários métodos e nenhum parece funcionar. Eu atualizei para 2.13.1, Windows XP, xlsx 0.3.0, não sei por que o erro continua aparecendo. Eu tentei:
AB<-read.xlsx("C:/AB_DNA_Tag_Numbers.xlsx","DNA_Tag_Numbers")
OU
AB<-read.xlsx("C:/AB_DNA_Tag_Numbers.xlsx",1)
mas recebo o erro:
Error in .jnew("java/io/FileInputStream", file) :
java.io.FileNotFoundException: C:\AB_DNA_Tag_Numbers.xlsx (The system cannot find the file specified)
Obrigado.
.csv
.file.exists("C:/AB_DNA_Tag_Numbers.xlsx")
?Respostas:
Para uma solução livre de dependências externas complicadas *, agora existe
readxl
:Ele pode ser instalado assim:
ou
Uso
* não é estritamente verdadeiro, requer o
Rcpp
pacote , que por sua vez requer Rtools (para Windows) ou Xcode (para OSX), que são dependências externas a R. Mas eles não requerem qualquer manipulação de caminhos, etc., então isso é um vantagem sobre as dependências Java e Perl.Atualizar Agora existe o pacote rexcel . Isso promete obter a formatação, funções e muitos outros tipos de informações do Excel do arquivo do Excel para o R.
fonte
Você também pode tentar o pacote XLConnect. Tive mais sorte do que o xlsx (além disso, ele pode ler arquivos .xls também).
também, se você está tendo problemas com o seu arquivo não sendo encontrado, tente selecioná-lo com file.choose ().
fonte
readWorksheet(loadWorkbook(...))
fazer o mesmo de maneira um pouco mais sucinta comreadWorksheetFromFile(...)
.Eu definitivamente tentaria a
read.xls
função nogdata
pacote, que é consideravelmente mais madura do que oxlsx
pacote. Pode exigir Perl ...fonte
Atualizar
Como a resposta abaixo está um pouco desatualizada, gostaria de chamar a atenção para o pacote readxl . Se a planilha do Excel estiver bem formatada / deitada , eu usaria readxl para ler a pasta de trabalho. Se as folhas estiverem mal formatadas / dispostas, eu ainda exportaria para CSV e lidaria com os problemas no R via
read.csv()
ou simplesreadLines()
.Original
Minha maneira preferida é salvar planilhas individuais do Excel em arquivos de valores separados por vírgula (CSV). No Windows, esses arquivos são associados ao Excel para que você não perca o "recurso" clique duplo para abrir no Excel.
Os arquivos CSV podem ser lidos em R usando
read.csv()
, ou, se você estiver em um local ou usando um computador configurado com algumas configurações europeias (onde,
é usado como a casa decimal), usandoread.csv2()
.Essas funções têm padrões sensíveis que simplificam a leitura de arquivos formatados apropriadamente. Basta manter todos os rótulos de amostras ou variáveis na primeira linha ou coluna.
Os benefícios adicionais de armazenamento de arquivos em CSV são que, como os arquivos são texto simples, podem ser passados facilmente e você pode ter certeza de que eles serão abertos em qualquer lugar; não é necessário Excel para examinar ou editar os dados.
fonte
read.xlsx()
e tem as versões mais recentes desse pacote e R, envie um e-mail ao mantenedor do pacote para relatar um bug em potencial.Exemplo 2012:
Exemplo 2015:
readxl
e tenho uma boa experiência com ele.fonte
Este novo pacote parece bom http://cran.r-project.org/web/packages/openxlsx/openxlsx.pdf Ele não requer rJava e está usando 'Rcpp' para velocidade.
fonte
Se você está tendo o mesmo problema e R está apresentando um erro - não foi possível encontrar a função ".jnew" - Basta instalar a biblioteca rJava. Ou se você já tem, basta executar a biblioteca de linha (rJava). Esse deve ser o problema.
Além disso, deve estar claro para todos que os arquivos csv e txt são mais fáceis de trabalhar, mas a vida não é fácil e às vezes você só precisa abrir um xlsx.
fonte
gdata
recebo a mensagem de inicializaçãogdata: read.xls support for 'XLSX' (Excel 2007+) files ENABLED.
Parece-me que deveria abrir arquivos xlsx, embora reconheço que não testei recentemente ...gdata
versão 2.8.2 lêxlsx
arquivos com aread.xls
função.Recentemente, descobri a função de Schaun Wheeler para importar arquivos do Excel para o R depois de perceber que o pacote xlxs não foi atualizado para o R 3.1.0.
https://gist.github.com/schaunwheeler/5825002
O nome do arquivo precisa ter a extensão ".xlsx" e o arquivo não pode ser aberto ao executar a função.
Esta função é muito útil para acessar o trabalho de outras pessoas. As principais vantagens sobre o uso da função read.csv são quando
Usar a função read.csv requer a abertura manual e o salvamento de cada documento Excel, o que é demorado e muito enfadonho. Usar a função de Schaun para automatizar o fluxo de trabalho é, portanto, uma grande ajuda.
Grandes adereços para Schaun para esta solução.
fonte
Para mim, o pacote openxlx funcionou da maneira mais fácil.
fonte
Qual é o seu sistema operacional? Qual versão do R você está executando: 32 bits ou 64 bits? Qual versão do Java você instalou?
Eu tive um erro semelhante quando comecei a usar a
read.xlsx()
função e descobri que meu problema (que pode ou não estar relacionado ao seu; no mínimo, esta resposta deve ser vista como "tente isso também") estava relacionado à incompatibilidade de .xlsx pacakge com Java de 64 bits. Tenho quase certeza de que o pacote .xlsx requer Java de 32 bits.Use R de 32 bits e certifique-se de que o Java de 32 bits esteja instalado. Isso pode resolver o seu problema.
fonte
O comentário acima deveria ter resolvido seu problema:
deve funcionar bem depois disso.
fonte
Você pode manter várias guias e mais informações de formatação se exportar para um arquivo de planilha OpenDocument ( ods ) ou um formato Excel mais antigo e importá-lo com o leitor ODS ou o leitor Excel mencionado acima.
fonte
Conforme declarado por muitos aqui, estou escrevendo a mesma coisa, mas com um ponto adicional!
Primeiramente, precisamos nos certificar de que nosso R Studio tenha estes dois pacotes instalados:
Para carregar um pacote em R, você pode usar a função abaixo:
a pesquisa exibirá a lista de pacotes atuais disponíveis em seu R Studio.
Agora, outro problema, mesmo que você possa ter esses dois pacotes, mas ainda possa encontrar problemas ao ler o arquivo "xlsx" e o erro pode ser como "erro: mais colunas do que o nome da coluna"
Para resolver este problema, você pode simplesmente salvar novamente sua planilha Excel "xlsx" em
e sua vida vai ser super facil ....
Diverta-se!!
fonte
Eu tentei muito com todas as respostas acima. No entanto, eles realmente não ajudaram porque eu usei um mac. A biblioteca rio possui esta função de importação que pode basicamente importar qualquer tipo de arquivo de dados para o Rstudio , mesmo aqueles arquivos em outros idiomas além do Inglês!
Experimente os códigos abaixo:
Espero esta ajuda. Para referências mais detalhadas: https://cran.r-project.org/web/packages/rio/vignettes/rio.html
fonte