Perguntas com a marcação «dataframe»

142
Determinar o número de valores de NA em uma coluna

Eu quero contar o número de NAvalores em uma coluna de quadro de dados. Digamos que meu quadro de dados seja chamado dfe o nome da coluna que estou considerando seja col. A maneira como inventei é a seguinte: sapply(df$col, function(x) sum(length(which(is.na(x))))) Essa é uma maneira boa / mais...

142
Renomear índice do DataFrame do Pandas

Eu tenho um arquivo csv sem cabeçalho, com um índice DateTime. Quero renomear o nome do índice e da coluna, mas com df.rename () apenas o nome da coluna é renomeado. Erro? Estou na versão 0.12.0 In [2]: df = pd.read_csv(r'D:\Data\DataTimeSeries_csv//seriesSM.csv', header=None, parse_dates=[[0]],...

137
Como salvar um data.frame no R?

Criei um data.frame em R que não é muito grande, mas leva algum tempo para ser construído. Gostaria de salvá-lo como um arquivo, que posso abrir novamente no

134
pandas valores únicos várias colunas

df = pd.DataFrame({'Col1': ['Bob', 'Joe', 'Bill', 'Mary', 'Joe'], 'Col2': ['Joe', 'Steve', 'Bob', 'Bob', 'Steve'], 'Col3': np.random.random(5)}) Qual é a melhor maneira de retornar os valores exclusivos de 'Col1' e 'Col2'? A saída desejada é 'Bob', 'Joe', 'Bill', 'Mary',

129
Como adicionar uma linha a um quadro de dados no R?

No R, como você adiciona uma nova linha a um quadro de dados depois que o quadro de dados já foi inicializado? Até agora eu tenho o seguinte: df <- data.frame("hi", "bye") names(df) <- c("hello", "goodbye") #I am trying to add "hola" and "ciao" as a new row de <- data.frame("hola",...

129
R - Concatenar dois quadros de dados?

Dados dois quadros de dados ae b: > a a b c 1 -0.2246894 -1.48167912 -1.65099363 2 0.5559320 -0.87898575 -0.15634590 3 1.8469466 -0.01487524 -0.53098215 4 -0.6875051 0.23880967 0.01824621 5 -0.6735163 0.75485292 0.44154092 > b a c 1 0.4287284 -0.3295925 2 0.5201492 0.3341251 3 -2.6355570...

129
Omitir linhas contendo coluna específica de NA

Quero saber como omitir NAvalores em um quadro de dados, mas apenas em algumas colunas em que estou interessado. Por exemplo, DF <- data.frame(x = c(1, 2, 3), y = c(0, 10, NA), z=c(NA, 33, 22)) mas eu só quero omitir os dados onde yestá NA, portanto o resultado deve ser x y z 1 1 0 NA 2 2...