Perguntas com a marcação «r-faq»

152
Remover linhas duplicadas

Eu li um CSVarquivo em um R data.frame. Algumas das linhas têm o mesmo elemento em uma das colunas. Gostaria de remover linhas duplicadas nessa coluna. Por exemplo: platform_external_dbus 202 16 google 1 platform_external_dbus 202 16 space-ghost.verbum 1 platform_external_dbus 202 16 localhost...

144
Substitua todos os 0 valores para NA

Eu tenho um quadro de dados com algumas colunas numéricas. Alguma linha tem um valor 0 que deve ser considerado nulo na análise estatística. Qual é a maneira mais rápida de substituir todo o valor 0 para NULL em R?

143
Adicionar legenda ao gráfico de linha ggplot2

Eu tenho uma pergunta sobre lendas no ggplot2. Consegui traçar três linhas no mesmo gráfico e quero adicionar uma legenda com as três cores usadas. Este é o código usado library(ggplot2) require(RCurl) link<-getURL("https://dl.dropbox.com/s/ds5zp9jonznpuwb/dat.txt") datos<-...

141
Substituindo NAs pelo valor mais recente não NA

Em um data.frame (ou data.table), eu gostaria de "preencher" NAs com o valor anterior não NA mais próximo. Um exemplo simples, usando vetores (em vez de a data.frame) é o seguinte: > y <- c(NA, 2, 2, NA, NA, 3, NA, 4, NA, NA) Eu gostaria de uma função fill.NAs()que me permita construir...

137
Encomende escala x discreta por frequência / valor

Estou fazendo um gráfico de barras esquivado usando ggplot com escala x discreta, o eixo x agora está organizado em ordem alfabética, mas preciso reorganizá-lo para que seja ordenado pelo valor do eixo y (ou seja, a barra mais alta será posicionado à esquerda). Eu tentei ordenar ou classificar,...

134
Ler apenas as colunas selecionadas

Alguém pode me dizer como ler apenas os primeiros 6 meses (7 colunas) para cada ano dos dados abaixo, por exemplo, usando read.table()? Year Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec 2009 -41 -27 -25 -31 -31 -39 -25 -15 -30 -27 -21 -25 2010 -41 -27 -25 -31 -31 -39 -25 -15 -30 -27 -21 -25...

134
Instalando a versão mais antiga do pacote R

Estou tentando usar o Rpy2 e o ggplot2, mas recebo um erro. Depois de pesquisar o erro online, descobri que o erro ocorre porque há alterações no pacote ggplot2 que ainda não estão refletidas no Rpy2 (por exemplo, consulte esta publicação (Editar: o link está morto)). Então agora eu preciso...

131
Como procurar materiais "R"? [fechadas]

Fechadas. Esta questão está fora de tópico . No momento, não está aceitando respostas. Deseja melhorar esta pergunta? Atualize a pergunta para que ela esteja no tópico do Stack Overflow. Fechado há 7 anos . Melhore esta pergunta "O Google" é...

124
O que "métodos S3" significa em R?

Como sou bastante novo no R, não sei quais são os métodos e objetos do S3. Descobri que existem sistemas de objetos S3 e S4 e alguns recomendam o uso do S3 sobre S4, se possível (consulte o Guia de estilo R do Google em http://google-styleguide.googlecode.com/svn/trunk/google-r-style. html ) *. No...

121
Contar o número de linhas em cada grupo

Tenho um dataframe e gostaria de contar o número de linhas dentro de cada grupo. Eu regularmente uso a aggregatefunção para somar os dados da seguinte forma: df2 <- aggregate(x ~ Year + Month, data = df1, sum) Agora, eu gostaria de contar observações, mas não consigo encontrar o argumento...

120
Sugestões gerais para depuração no R

Eu recebo um erro ao usar uma função R que escrevi: Warning messages: 1: glm.fit: algorithm did not converge 2: glm.fit: algorithm did not converge O que eu fiz: Percorrer a função Adicionar impressão para descobrir em que linha o erro ocorre sugere duas funções que não devem ser usadas...

119
Passe um nome de coluna data.frame para uma função

Estou tentando escrever uma função para aceitar um data.frame ( x) e um columndele. A função executa alguns cálculos em xe posteriormente retorna outro data.frame. Estou preso no método de práticas recomendadas para passar o nome da coluna para a função. Os dois exemplos mínimos fun1e fun2abaixo...