Perguntas com a marcação «pandas»

251

Como encontrar a versão do pandas instalada

Estou tendo problemas com algumas das funcionalidades dos pandas. Como verifico qual é a minha versão de

python pandas

244

Mostrar DataFrame como tabela no iPython Notebook

Estou usando o notebook iPython. Quando eu faço isso: df Recebo uma linda mesa com celas. No entanto, se eu fizer isso: df1 df2 não imprime a primeira mesa bonita. Se eu tentar isso: print df1 print df2 Ela imprime a tabela em um formato diferente, que espalha colunas e torna a saída muito...

pandas printing ipython-notebook jupyter-notebook display

243

Obter as linhas que têm a contagem máxima em grupos usando groupby

Como localizo todas as linhas em um dataframe do pandas que tenham o valor máximo para a countcoluna após o agrupamento por ['Sp','Mt']colunas? Exemplo 1: o seguinte dataFrame, que eu agrupo por ['Sp','Mt']: Sp Mt Value count 0 MM1 S1 a **3** 1 MM1 S1 n 2 2 MM1 S3 cb 5 3 MM2 S3 mk **8** 4 MM2 S4...

python pandas max pandas-groupby

242

Pandas: reduza um nível de um índice de coluna multinível?

Se eu tenho um índice de coluna multinível: >>> cols = pd.MultiIndex.from_tuples([("a", "b"), ("a", "c")]) >>> pd.DataFrame([[1,2], [3,4]], columns=cols) uma --- + - b c - + --- + - 0 1 | 2 1 | 3 4 Como posso descartar o nível "a" desse índice, terminando com: b c - +...

python pandas

241

Conversão Pandas Column para DateTime

Eu tenho um campo em um DataFrame do pandas que foi importado como formato de string. Deve ser uma variável datetime. Como faço para convertê-lo em uma coluna datetime e depois filtrar com base na data. Exemplo: Nome do DataFrame: raw_data Nome da coluna: Mycol Formato do valor na coluna:...

python datetime pandas

239

Por que a função 'aplicar' do meu Panda, que faz referência a várias colunas, não está funcionando? [fechadas]

Fechadas. Esta pergunta não é reproduzível ou foi causada por erros de digitação . No momento, não está aceitando respostas. Deseja melhorar esta pergunta? Atualize a pergunta para que ela esteja no tópico do Stack Overflow. Fechado no ano passado ....

python python-2.7 pandas dataframe apply

239

Pandas lidos na tabela sem cabeçalhos

Como posso ler em um arquivo .csv (sem cabeçalhos) e quando quero apenas um subconjunto de colunas (digamos 4 e 7 de um total de 20 colunas) usando pandas? Eu não consigo ser capaz de

python pandas

237

como classificar o dataframe de pandas de uma coluna

Eu tenho um quadro de dados como este: print(df) 0 1 2 0 354.7 April 4.0 1 55.4 August 8.0 2 176.5 December 12.0 3 95.5 February 2.0 4 85.6 January 1.0 5 152 July 7.0 6 238.7 June 6.0 7 104.8 March 3.0 8 283.5 May 5.0 9 278.8 November 11.0 10 249.6 October 10.0 11 212.7 September 9.0 Como você...

python pandas sorting

235

Selecionando com critérios complexos em pandas.DataFrame

Por exemplo, eu tenho DF simples: import pandas as pd from random import randint df = pd.DataFrame({'A': [randint(1, 9) for x in xrange(10)], 'B': [randint(1, 9)*10 for x in xrange(10)], 'C': [randint(1, 9)*100 for x in xrange(10)]}) Posso selecionar valores de 'A' para os quais os valores...

python pandas

234

Como selecionar linhas com um ou mais valores nulos de um DataFrame do pandas sem listar explicitamente as colunas?

Eu tenho um dataframe com ~ 300K linhas e ~ 40 colunas. Quero descobrir se alguma linha contém valores nulos - e colocar essas linhas 'nulas' em um dataframe separado, para que eu possa explorá-las facilmente. Eu posso criar uma máscara explicitamente: mask = False for col in df.columns: mask =...

python pandas null nan

230

Converter carros alegóricos em polegadas em Pandas?

Eu tenho trabalhado com dados importados de um CSV. O Pandas mudou algumas colunas para flutuar, agora os números nessas colunas são exibidos como pontos flutuantes! No entanto, preciso que eles sejam exibidos como números inteiros ou sem vírgula. Existe uma maneira de convertê-los em números...

python pandas floating-point integer dataset

229

pandas obtêm linhas que NÃO estão em outro dataframe

Eu tenho dois quadros de dados de pandas que têm algumas linhas em comum. Suponha que dataframe2 seja um subconjunto de dataframe1. Como posso obter as linhas do dataframe1 que não estão no dataframe2? df1 = pandas.DataFrame(data = {'col1' : [1, 2, 3, 4, 5], 'col2' : [10, 11, 12, 13, 14]}) df2...

python pandas dataframe

229

Como posso obter o NOT lógico por elementos de uma série de pandas?

Eu tenho um Seriesobjeto pandas contendo valores booleanos. Como posso obter uma série contendo a lógica NOTde cada valor? Por exemplo, considere uma série contendo: True True True False A série que eu gostaria de obter conteria: False False False True Parece que deve ser razoavelmente...

python pandas boolean-logic

227

Normalizar colunas do quadro de dados do pandas

Eu tenho um quadro de dados em pandas onde cada coluna tem um intervalo de valores diferente. Por exemplo: df: A B C 1000 10 0.5 765 5 0.35 800 7 0.09 Alguma idéia de como posso normalizar as colunas desse quadro de dados em que cada valor está entre 0 e 1? Minha saída desejada é: A B C 1 1...

python pandas dataframe normalize

221

Extraindo apenas mês e ano separadamente da coluna Pandas Datetime

Eu tenho um Dataframe, df, com a seguinte coluna: df['ArrivalDate'] = ... 936 2012-12-31 938 2012-12-29 965 2012-12-31 966 2012-12-31 967 2012-12-31 968 2012-12-31 969 2012-12-31 970 2012-12-29 971 2012-12-31 972 2012-12-29 973 2012-12-29 ... Os elementos da coluna são

python pandas

221

Como fazer bons exemplos de pandas reproduzíveis

As respostas desta pergunta são um esforço da comunidade . Edite as respostas existentes para melhorar esta postagem. No momento, não está aceitando novas respostas ou interações. Tendo passado bastante tempo assistindo os dois r e pandasNo SO, a impressão que tenho...

python pandas

221

Aplique várias funções a várias colunas de grupo

Os documentos mostram como aplicar várias funções em um objeto de grupo por vez, usando um dict com os nomes das colunas de saída como as chaves: In [563]: grouped['D'].agg({'result1' : np.sum, .....: 'result2' : np.mean}) .....: Out[563]: result2 result1 A bar -0.579846 -1.739537 foo...

python group-by aggregate-functions pandas

220

Obter índice de coluna do nome da coluna em pandas python

Em R, quando você precisa recuperar um índice de coluna com base no nome da coluna, você pode fazer idx <- which(names(my_data)==my_colum_name) Existe uma maneira de fazer o mesmo com os quadros de dados do

python pandas dataframe indexing

219

descartando valores infinitos de quadros de dados em pandas?

qual é a maneira mais rápida / simples de eliminar os valores nan e inf / -inf de um DataFrame do pandas sem redefinir mode.use_inf_as_null? Eu gostaria de poder usar os argumentos subsete , exceto com valores considerados ausentes, como:howdropnainf df.dropna(subset=["col1", "col2"], how="all",...

python numpy scipy pandas

217

Os pandas substituem o NaN por uma sequência em branco / vazia

Eu tenho um Dataframe do Pandas, como mostrado abaixo: 1 2 3 0 a NaN read 1 b l unread 2 c NaN read Quero remover os valores NaN com uma string vazia para que fique assim: 1 2 3 0 a "" read 1 b l unread 2 c ""

python pandas dataframe nan