Perguntas com a marcação «pandas»

365
Pandas mesclando 101

Como realizar uma junção ( LEFT| RIGHT| FULL) ( INNER| OUTER) com pandas? Como adicionar NaNs para linhas ausentes após a mesclagem? Como me livrar dos NaNs após a fusão? Posso mesclar no índice? Cruzar-se com pandas? Como mesclar vários DataFrames? merge? join? concat? update? Quem? O que? Por...

358
Como dinamizar um quadro de dados

O que é pivô? Como eu giro? Isso é um pivô? Formato longo para formato amplo? Eu já vi muitas perguntas sobre tabelas dinâmicas. Mesmo que eles não saibam que estão perguntando sobre tabelas dinâmicas, geralmente o são. É praticamente impossível escrever uma pergunta e resposta canônica que...

341
Erro do Python Pandas ao tokenizar dados

Estou tentando usar pandas para manipular um arquivo .csv, mas recebo este erro: pandas.parser.CParserError: Erro ao tokenizar dados. Erro C: 2 campos esperados na linha 3, serra 12 Eu tentei ler os documentos dos pandas, mas não encontrei nada. Meu código é simples: path = 'GOOG Key...

325
Pandas - Como nivelar um índice hierárquico em colunas

Eu tenho um quadro de dados com um índice hierárquico no eixo 1 (colunas) (de uma groupby.aggoperação): USAF WBAN year month day s_PC s_CL s_CD s_CNT tempf sum sum sum sum amax amin 0 702730 26451 1993 1 1 1 0 12 13 30.92 24.98 1 702730 26451 1993 1 2 0 0 13 13 32.00 24.98 2 702730 26451 1993 1...

318
Remapear valores na coluna pandas com um dict

Eu tenho um dicionário que se parece com isso: di = {1: "A", 2: "B"} Gostaria de aplicá-lo à coluna "col1" de um dataframe semelhante a: col1 col2 0 w a 1 1 2 2 2 NaN para obter: col1 col2 0 w a 1 A 2 2 B NaN Como posso fazer isso da melhor maneira? Por alguma razão, os termos do Google...

317
Como armazenar um quadro de dados usando o Pandas

No momento, estou importando um quadro de dados bastante grande CSVtoda vez que executo o script. Existe uma boa solução para manter esse dataframe constantemente disponível entre as execuções, para que eu não precise gastar todo esse tempo esperando a execução do

299
Converter dict Python em um dataframe

Eu tenho um dicionário Python como o seguinte: {u'2012-06-08': 388, u'2012-06-09': 388, u'2012-06-10': 388, u'2012-06-11': 389, u'2012-06-12': 389, u'2012-06-13': 389, u'2012-06-14': 389, u'2012-06-15': 389, u'2012-06-16': 389, u'2012-06-17': 389, u'2012-06-18': 390, u'2012-06-19':...

290
Convertendo entre datetime, timestamp e datetime64

Como faço para converter um numpy.datetime64objeto em um datetime.datetime(ou Timestamp)? No código a seguir, crio objetos datetime, timestamp e datetime64. import datetime import numpy as np import pandas as pd dt = datetime.datetime(2012, 5, 1) # A strange way to extract a Timestamp object,...

289
obter lista da coluna dataframe do pandas

Eu tenho um documento do Excel que se parece com isso .. cluster load_date budget actual fixed_price A 1/1/2014 1000 4000 Y A 2/1/2014 12000 10000 Y A 3/1/2014 36000 2000 Y B 4/1/2014 15000 10000 N B 4/1/2014 12000 11500 N B 4/1/2014 90000 11000 N C 7/1/2014 22000 18000 N C 8/1/2014 30000 28960...