Perguntas com a marcação «pandas»

113
Pretty Printing a dataframe do pandas

Como posso imprimir um dataframe do pandas como uma boa tabela baseada em texto, como a seguir? +------------+---------+-------------+ | column_one | col_two | column_3 | +------------+---------+-------------+ | 0 | 0.0001 | ABCD | | 1 | 1e-005 | ABCD | | 2 | 1e-006 | long string | | 3 | 1e-007 |...

112
Fazendo mapa de calor de pandas DataFrame

Eu tenho um dataframe gerado a partir do pacote Pandas do Python. Como posso gerar mapa de calor usando DataFrame do pacote pandas. import numpy as np from pandas import * Index= ['aaa','bbb','ccc','ddd','eee'] Cols = ['A', 'B', 'C','D'] df = DataFrame(abs(np.random.randn(5, 4)), index= Index,...

112
Insira uma linha no dataframe do pandas

Eu tenho um dataframe: s1 = pd.Series([5, 6, 7]) s2 = pd.Series([7, 8, 9]) df = pd.DataFrame([list(s1), list(s2)], columns = ["A", "B", "C"]) A B C 0 5 6 7 1 7 8 9 [2 rows x 3 columns] e preciso adicionar uma primeira linha [2, 3, 4] para obter: A B C 0 2 3 4 1 5 6 7 2 7 8 9 Tentei o...

110
Quando devo usar o Pandas apply () no meu código?

Tenho visto muitas respostas postadas para perguntas no Stack Overflow envolvendo o uso do método Pandas apply. Eu também vi usuários comentando abaixo deles dizendo que " applyé lento e deve ser evitado". Eu li muitos artigos sobre o tópico de desempenho que explicam que applyé lento. Também vi...

110
Atribuir dtypes de coluna de dataframe ao pandas

Quero definir os dtypes de várias colunas em pd.Dataframe(tenho um arquivo que tive que analisar manualmente em uma lista de listas, pois o arquivo não era acessível pd.read_csv) import pandas as pd print pd.DataFrame([['a','1'],['b','2']], dtype={'x':'object','y':'int'}, columns=['x','y']) eu...

109
Python Pandas mescla apenas algumas colunas

É possível mesclar apenas algumas colunas? Eu tenho um DataFrame df1 com colunas x, y, z e df2 com colunas x, a, b, c, d, e, f, etc. Quero mesclar os dois DataFrames em x, mas só quero mesclar as colunas df2.a, df2.b - não o DataFrame inteiro. O resultado seria um DataFrame com x, y, z, a,...

109
Estratégias de teste do método Pandas read_xml ()

Atualmente, as ferramentas Pandas I / O não mantêm um read_xml()método e a contraparte to_xml(). No entanto, read_jsonprova que estruturas semelhantes a árvores podem ser implementadas para importação de dataframe e read_htmlpara formatos de marcação. Se a equipe de pandas faz considerar tal...

108
produto cartesiano em pandas

Eu tenho dois dataframes do pandas: from pandas import DataFrame df1 = DataFrame({'col1':[1,2],'col2':[3,4]}) df2 = DataFrame({'col3':[5,6]}) Qual é a prática recomendada para obter seu produto cartesiano (claro, sem escrever explicitamente como eu)? #df1, df2 cartesian product df_cartesian =...

108
Leia um arquivo compactado como um DataFrame do pandas

Estou tentando descompactar um arquivo csv e passá-lo para o pandas para que eu possa trabalhar no arquivo. O código que tentei até agora é: import requests, zipfile, StringIO r = requests.get('http://data.octo.dc.gov/feeds/crime_incidents/archive/crime_incidents_2013_CSV.zip') z =...

108
Pandas a cada enésima linha

Dataframe.resample () funciona apenas com dados de série temporal. Não consigo encontrar uma maneira de obter cada enésima linha de dados que não sejam da série temporal. Qual é o melhor