Perguntas com a marcação «dplyr»

Use esta tag para questões relacionadas às funções do pacote dplyr, como group_by, sumarizar, filtrar e selecionar.

192
Exibir / imprimir todas as linhas de uma rampa (tbl_df)

tibble(anteriormente tbl_df) é uma versão de um quadro de dados criado pelo dplyrpacote de manipulação do quadro de dados em R. Ele evita saídas longas da tabela ao chamar acidentalmente o quadro de dados. Depois que um quadro de dados é agrupado por tibble/ tbl_df, existe um comando para exibir...

188
Filtrar linhas que contêm uma determinada sequência

Eu tenho que filtrar um quadro de dados usando como critério a linha na qual está a string RTB. Estou usando dplyr. d.del <- df %.% group_by(TrackingPixel) %.% summarise(MonthDelivery = as.integer(sum(Revenue))) %.% arrange(desc(MonthDelivery)) Eu sei que posso usar a função filter,...

175
Extrair uma coluna dplyr tbl como um vetor

Existe uma maneira mais sucinta de obter uma coluna de um dplyr tbl como vetor, de um tbl com back-end de banco de dados (ou seja, o quadro / tabela de dados não pode ser subconjunto diretamente)? require(dplyr) db <- src_sqlite(tempfile(), create = TRUE) iris2 <- copy_to(db,...

170
Corrigindo um aviso múltiplo "coluna desconhecida"

Eu tenho um aviso múltiplo persistente de "coluna desconhecida" para todos os tipos de comandos (por exemplo, str (x) para instalar atualizações em pacotes) e não tenho certeza de como depurar isso ou corrigi-lo. O aviso "coluna desconhecida" está claramente relacionado a uma variável em um...

168
Use nomes de variáveis ​​dinâmicas no `dplyr`

Eu quero usar dplyr::mutate()para criar várias novas colunas em um quadro de dados. Os nomes das colunas e seu conteúdo devem ser gerados dinamicamente. Dados de exemplo da íris: library(dplyr) iris <- tbl_df(iris) Eu criei uma função para alterar minhas novas colunas da...

153
Frequências / proporções relativas com dplyr

Suponha que eu queira calcular a proporção de valores diferentes dentro de cada grupo. Por exemplo, usando os mtcarsdados, como faço para calcular a frequência relativa do número de marchas por am (automático / manual) de uma só vez dplyr? library(dplyr) data(mtcars) mtcars <- tbl_df(mtcars) #...

137
Selecione a primeira e a última linha dos dados agrupados

Questão Usando dplyr, como faço para selecionar as observações / linhas superior e inferior dos dados agrupados em uma instrução? Dados e exemplo Dado um quadro de dados df <- data.frame(id=c(1,1,1,2,2,2,3,3,3), stopId=c("a","b","c","a","b","c","a","b","c"),

128
Remova linhas duplicadas usando o dplyr

Eu tenho um data.frame assim - set.seed(123) df = data.frame(x=sample(0:1,10,replace=T),y=sample(0:1,10,replace=T),z=1:10) > df x y z 1 0 1 1 2 1 0 2 3 0 1 3 4 1 1 4 5 1 0 5 6 0 1 6 7 1 0 7 8 1 0 8 9 1 0 9 10 0 1 10 Gostaria de remover linhas duplicadas com base nas duas primeiras colunas....

118
Substituição para “renomear” no dplyr

Eu gosto da função de renomeação de plyr rename. Recentemente comecei a usar o dplyr e gostaria de saber se existe uma maneira fácil de renomear variáveis ​​usando uma função de dplyr, que seja tão fácil de usar quanto a de plyr

111
O dplyr pode se unir em várias colunas ou chave composta?

Sei que a dplyrv3.0 permite que você junte variáveis ​​diferentes: left_join(x, y, by = c("a" = "b")vai combinar x.acomy.b No entanto, é possível juntar em uma combinação de variáveis ​​ou eu tenho que adicionar uma chave composta antes? Algo assim: left_join(x, y, by = c("a c" = "b d")para...

108
Reúna vários conjuntos de colunas

Tenho dados de uma pesquisa online em que os entrevistados fazem uma série de perguntas de 1 a 3 vezes. O software de pesquisa (Qualtrics) registra esses dados em várias colunas, ou seja, Q3.2 na pesquisa terá colunasQ3.2.1. , Q3.2.2.e Q3.2.3.: df <- data.frame( id = 1:10, time =...

103
Soma em várias colunas com dplyr

Minha pergunta envolve somar valores em várias colunas de um quadro de dados e criar uma nova coluna correspondente a esse somatório usando dplyr. As entradas de dados nas colunas são binárias (0,1). Estou pensando em um análogo de linha da função summarise_eachou mutate_eachde dplyr. Abaixo...