Perguntas com a marcação «dplyr»

96
R dplyr: eliminar várias colunas

Eu tenho um dataframe e uma lista de colunas nesse dataframe que gostaria de descartar. Vamos usar o irisconjunto de dados como exemplo. Eu gostaria de deixar cair Sepal.Lengthe Sepal.Widthe utilizar apenas as colunas restantes. Como faço isso usando selectou select_do dplyrpacote? Aqui está o que...

92
Obtendo os melhores valores por grupo

Aqui está um exemplo de quadro de dados: d <- data.frame( x = runif(90), grp = gl(3, 30) ) Eu quero que o subconjunto dcontenha as linhas com os 5 principais valores de xpara cada valor de grp. Usando a base R, minha abordagem seria algo como: ordered <- d[order(d$x, decreasing =...

89
dplyr em data.table, estou realmente usando data.table?

Se eu usar a sintaxe dplyr no topo de uma tabela de dados , obtenho todos os benefícios de velocidade da tabela de dados enquanto ainda uso a sintaxe de dplyr? Em outras palavras, eu uso indevidamente a tabela de dados se a consultar com a sintaxe dplyr? Ou preciso usar sintaxe de tabela de...

87
dplyr muda com valores condicionais

Em um grande dataframe ("myfile") com quatro colunas, tenho que adicionar uma quinta coluna com valores condicionalmente baseados nas primeiras quatro colunas. Prefira respostas com dplyr e mutate, principalmente por causa de sua velocidade em grandes conjuntos de dados. Meu dataframe é...

18
Como substituir NA por conjunto de valores

Eu tenho o seguinte quadro de dados: library(dplyr) library(tibble) df <- tibble( source = c("a", "b", "c", "d", "e"), score = c(10, 5, NA, 3, NA ) ) df Se parece com isso: # A tibble: 5 x 2 source score <chr> <dbl> 1 a 10 . # current max value 2 b 5 3 c NA 4 d 3 5 e...