Perguntas com a marcação «pandas»

136
Como carregar um arquivo tsv em um Pandas DataFrame?

Eu sou novo em python e pandas. Estou tentando tsvcarregar um arquivo em um panda DataFrame. Isto é o que estou tentando e o erro que estou recebendo: >>> df1 = DataFrame(csv.reader(open('c:/~/trainSetRel3.txt'), delimiter='\t')) Traceback (most recent call last): File...

136
Pandas dividem a coluna de listas em várias colunas

Eu tenho um DataFrame de pandas com uma coluna: import pandas as pd df = pd.DataFrame( data={ "teams": [ ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ] } ) print(df) Resultado: teams 0 [SF, NYG] 1 [SF, NYG] 2 [SF, NYG] 3...

134
pandas valores únicos várias colunas

df = pd.DataFrame({'Col1': ['Bob', 'Joe', 'Bill', 'Mary', 'Joe'], 'Col2': ['Joe', 'Steve', 'Bob', 'Bob', 'Steve'], 'Col3': np.random.random(5)}) Qual é a melhor maneira de retornar os valores exclusivos de 'Col1' e 'Col2'? A saída desejada é 'Bob', 'Joe', 'Bill', 'Mary',

134
ImportError: nenhum módulo chamado dateutil.parser

Estou recebendo o seguinte erro ao importar pandasem um Pythonprograma monas-mbp:book mona$ sudo pip install python-dateutil Requirement already satisfied (use --upgrade to upgrade): python-dateutil in /System/Library/Frameworks/Python.framework/Versions/2.7/Extras/lib/python Cleaning...

133
Como imprimir um objeto groupby

Quero imprimir o resultado do agrupamento com os pandas. Eu tenho um quadro de dados: import pandas as pd df = pd.DataFrame({'A': ['one', 'one', 'two', 'three', 'three', 'one'], 'B': range(6)}) print(df) A B 0 one 0 1 one 1 2 two 2 3 three 3 4 three 4 5 one 5 Ao imprimir após o agrupamento por...

131
Pandas convertem dataframe em matriz de tuplas

Manipulei alguns dados usando pandas e agora quero executar um salvamento em lote no banco de dados. Isso requer que eu converta o quadro de dados em uma matriz de tuplas, com cada tupla correspondendo a uma "linha" do quadro de dados. Meu DataFrame se parece com: In [182]: data_set Out[182]:...

131
Normalizar dados em pandas

Suponha que eu tenha um quadro de dados do pandas df: Quero calcular a média da coluna de um quadro de dados. Isso é facil: df.apply(average) então o intervalo sábio da coluna max (col) - min (col). Isso é fácil novamente: df.apply(max) - df.apply(min) Agora, para cada elemento, quero...

130
como verificar o tipo de uma coluna em pandas python

Eu preciso usar funções diferentes para tratar colunas numéricas e colunas de seqüência de caracteres. O que estou fazendo agora é realmente burro: allc = list((agg.loc[:, (agg.dtypes==np.float64)|(agg.dtypes==np.int)]).columns) for y in allc: treat_numeric(agg[y]) allc = list((agg.loc[:,...

130
verifique se a variável é dataframe

quando minha função f é chamada com uma variável, quero verificar se var é um dataframe do pandas: def f(var): if var == pd.DataFrame(): print "do stuff" Eu acho que a solução pode ser bastante simples, mas mesmo com def f(var): if var.values != None: print "do stuff" Não consigo fazê-lo...