Perguntas com a marcação «pandas»

146
Como fazer um loop sobre o dataframe agrupado do Pandas?

Quadro de dados: c_os_family_ss c_os_major_is l_customer_id_i 0 Windows 7 90418 1 Windows 7 90418 2 Windows 7 90418 Código: print df for name, group in df.groupby('l_customer_id_i').agg(lambda x: ','.join(x)): print name print group Estou tentando apenas fazer um loop sobre os dados...

144
Lendo um arquivo do Excel em python usando pandas

Estou tentando ler um arquivo do Excel desta maneira: newFile = pd.ExcelFile(PATH\FileName.xlsx) ParsedData = pd.io.parsers.ExcelFile.parse(newFile) que gera um erro que diz dois argumentos esperados, não sei qual é o segundo argumento e também o que estou tentando obter aqui é converter um...

143
JSON para pandas DataFrame

O que estou tentando fazer é extrair dados de elevação de uma API do google maps ao longo de um caminho especificado pelas coordenadas de latitude e longitude da seguinte maneira: from urllib2 import Request, urlopen import json path1 =

143
Modificando um subconjunto de linhas em um dataframe do pandas

Suponha que eu tenho um DataFrame do pandas com duas colunas, A e B. Eu gostaria de modificar esse DataFrame (ou criar uma cópia) para que B seja sempre NaN sempre que A for 0. Como eu conseguiria isso? Eu tentei o seguinte df['A'==0]['B'] = np.nan e df['A'==0]['B'].values.fill(np.nan) sem...

142
Procure por "não contém" em um DataFrame em pandas

Eu fiz algumas pesquisas e não consigo descobrir como filtrar um dataframe df["col"].str.contains(word), no entanto, estou me perguntando se existe uma maneira de fazer o inverso: filtrar um dataframe pelo elogio desse conjunto. por exemplo: para o efeito de !(df["col"].str.contains(word)). Isso...

142
Renomear índice do DataFrame do Pandas

Eu tenho um arquivo csv sem cabeçalho, com um índice DateTime. Quero renomear o nome do índice e da coluna, mas com df.rename () apenas o nome da coluna é renomeado. Erro? Estou na versão 0.12.0 In [2]: df = pd.read_csv(r'D:\Data\DataTimeSeries_csv//seriesSM.csv', header=None, parse_dates=[[0]],...

141
Substituindo valores de coluna em um DataFrame do pandas

Estou tentando substituir os valores em uma coluna de um dataframe. A coluna ('feminino') contém apenas os valores 'feminino' e 'masculino'. Eu tentei o seguinte: w['female']['female']='1' w['female']['male']='0' Mas receba exatamente a mesma cópia dos resultados anteriores. Idealmente,...

138
Pandas read_csv do URL

Estou usando o Python 3.4 com IPython e tenho o seguinte código. Não consigo ler um arquivo csv a partir do URL fornecido: import pandas as pd import requests url="https://github.com/cs109/2014_data/blob/master/countries.csv" s=requests.get(url).content c=pd.read_csv(s) Eu tenho o seguinte...