Estou tendo problemas com algumas das funcionalidades dos pandas. Como verifico qual é a minha versão de
Estou tendo problemas com algumas das funcionalidades dos pandas. Como verifico qual é a minha versão de
Estou usando o notebook iPython. Quando eu faço isso: df Recebo uma linda mesa com celas. No entanto, se eu fizer isso: df1 df2 não imprime a primeira mesa bonita. Se eu tentar isso: print df1 print df2 Ela imprime a tabela em um formato diferente, que espalha colunas e torna a saída muito...
Como localizo todas as linhas em um dataframe do pandas que tenham o valor máximo para a countcoluna após o agrupamento por ['Sp','Mt']colunas? Exemplo 1: o seguinte dataFrame, que eu agrupo por ['Sp','Mt']: Sp Mt Value count 0 MM1 S1 a **3** 1 MM1 S1 n 2 2 MM1 S3 cb 5 3 MM2 S3 mk **8** 4 MM2 S4...
Se eu tenho um índice de coluna multinível: >>> cols = pd.MultiIndex.from_tuples([("a", "b"), ("a", "c")]) >>> pd.DataFrame([[1,2], [3,4]], columns=cols) uma --- + - b c - + --- + - 0 1 | 2 1 | 3 4 Como posso descartar o nível "a" desse índice, terminando com: b c - +...
Eu tenho um campo em um DataFrame do pandas que foi importado como formato de string. Deve ser uma variável datetime. Como faço para convertê-lo em uma coluna datetime e depois filtrar com base na data. Exemplo: Nome do DataFrame: raw_data Nome da coluna: Mycol Formato do valor na coluna:...
Fechadas. Esta pergunta não é reproduzível ou foi causada por erros de digitação . No momento, não está aceitando respostas. Deseja melhorar esta pergunta? Atualize a pergunta para que ela esteja no tópico do Stack Overflow. Fechado no ano passado ....
Como posso ler em um arquivo .csv (sem cabeçalhos) e quando quero apenas um subconjunto de colunas (digamos 4 e 7 de um total de 20 colunas) usando pandas? Eu não consigo ser capaz de
Eu tenho um quadro de dados como este: print(df) 0 1 2 0 354.7 April 4.0 1 55.4 August 8.0 2 176.5 December 12.0 3 95.5 February 2.0 4 85.6 January 1.0 5 152 July 7.0 6 238.7 June 6.0 7 104.8 March 3.0 8 283.5 May 5.0 9 278.8 November 11.0 10 249.6 October 10.0 11 212.7 September 9.0 Como você...
Por exemplo, eu tenho DF simples: import pandas as pd from random import randint df = pd.DataFrame({'A': [randint(1, 9) for x in xrange(10)], 'B': [randint(1, 9)*10 for x in xrange(10)], 'C': [randint(1, 9)*100 for x in xrange(10)]}) Posso selecionar valores de 'A' para os quais os valores...
Eu tenho um dataframe com ~ 300K linhas e ~ 40 colunas. Quero descobrir se alguma linha contém valores nulos - e colocar essas linhas 'nulas' em um dataframe separado, para que eu possa explorá-las facilmente. Eu posso criar uma máscara explicitamente: mask = False for col in df.columns: mask =...
Eu tenho trabalhado com dados importados de um CSV. O Pandas mudou algumas colunas para flutuar, agora os números nessas colunas são exibidos como pontos flutuantes! No entanto, preciso que eles sejam exibidos como números inteiros ou sem vírgula. Existe uma maneira de convertê-los em números...
Eu tenho dois quadros de dados de pandas que têm algumas linhas em comum. Suponha que dataframe2 seja um subconjunto de dataframe1. Como posso obter as linhas do dataframe1 que não estão no dataframe2? df1 = pandas.DataFrame(data = {'col1' : [1, 2, 3, 4, 5], 'col2' : [10, 11, 12, 13, 14]}) df2...
Eu tenho um Seriesobjeto pandas contendo valores booleanos. Como posso obter uma série contendo a lógica NOTde cada valor? Por exemplo, considere uma série contendo: True True True False A série que eu gostaria de obter conteria: False False False True Parece que deve ser razoavelmente...
Eu tenho um quadro de dados em pandas onde cada coluna tem um intervalo de valores diferente. Por exemplo: df: A B C 1000 10 0.5 765 5 0.35 800 7 0.09 Alguma idéia de como posso normalizar as colunas desse quadro de dados em que cada valor está entre 0 e 1? Minha saída desejada é: A B C 1 1...
Eu tenho um Dataframe, df, com a seguinte coluna: df['ArrivalDate'] = ... 936 2012-12-31 938 2012-12-29 965 2012-12-31 966 2012-12-31 967 2012-12-31 968 2012-12-31 969 2012-12-31 970 2012-12-29 971 2012-12-31 972 2012-12-29 973 2012-12-29 ... Os elementos da coluna são
As respostas desta pergunta são um esforço da comunidade . Edite as respostas existentes para melhorar esta postagem. No momento, não está aceitando novas respostas ou interações. Tendo passado bastante tempo assistindo os dois r e pandasNo SO, a impressão que tenho...
Os documentos mostram como aplicar várias funções em um objeto de grupo por vez, usando um dict com os nomes das colunas de saída como as chaves: In [563]: grouped['D'].agg({'result1' : np.sum, .....: 'result2' : np.mean}) .....: Out[563]: result2 result1 A bar -0.579846 -1.739537 foo...
Em R, quando você precisa recuperar um índice de coluna com base no nome da coluna, você pode fazer idx <- which(names(my_data)==my_colum_name) Existe uma maneira de fazer o mesmo com os quadros de dados do
qual é a maneira mais rápida / simples de eliminar os valores nan e inf / -inf de um DataFrame do pandas sem redefinir mode.use_inf_as_null? Eu gostaria de poder usar os argumentos subsete , exceto com valores considerados ausentes, como:howdropnainf df.dropna(subset=["col1", "col2"], how="all",...
Eu tenho um Dataframe do Pandas, como mostrado abaixo: 1 2 3 0 a NaN read 1 b l unread 2 c NaN read Quero remover os valores NaN com uma string vazia para que fique assim: 1 2 3 0 a "" read 1 b l unread 2 c ""