Como selecionar linhas de um com DataFramebase em valores em alguma coluna no Python Pandas? No SQL, eu usaria: SELECT * FROM table WHERE colume_name = some_value Tentei examinar a documentação dos pandas, mas não encontrei a resposta
Pandas é uma biblioteca Python para manipulação e análise de dados, por exemplo, quadros de dados, séries temporais multidimensionais e conjuntos de dados transversais comumente encontrados em estatísticas, resultados de ciências experimentais, econometria ou finanças. O Pandas é uma das principais bibliotecas de ciência de dados em Python.
Como selecionar linhas de um com DataFramebase em valores em alguma coluna no Python Pandas? No SQL, eu usaria: SELECT * FROM table WHERE colume_name = some_value Tentei examinar a documentação dos pandas, mas não encontrei a resposta
Eu tenho um DataFramedos pandas: import pandas as pd inp = [{'c1':10, 'c2':100}, {'c1':11,'c2':110}, {'c1':12,'c2':120}] df = pd.DataFrame(inp) print df Resultado: c1 c2 0 10 100 1 11 110 2 12 120 Agora eu quero percorrer as linhas desse quadro. Para cada linha, quero poder acessar seus...
Eu tenho um DataFrame usando pandas e rótulos de coluna que preciso editar para substituir os rótulos originais da coluna. Gostaria de alterar os nomes das colunas em um DataFrame Aonde os nomes das colunas originais são: ['$a', '$b', '$c', '$d', '$e'] para ['a', 'b', 'c', 'd', 'e']. Tenho...
Ao excluir uma coluna em um DataFrame, eu uso: del df['column_name'] E isso funciona muito bem. Por que não consigo usar o seguinte? del df.column_name Como é possível acessar a coluna / série como df.column_name, eu esperava que isso
Eu tenho dados em colunas diferentes, mas não sei como extraí-los para salvá-los em outra variável. index a b c 1 2 3 4 2 3 4 5 Como faço para selecionar 'a', 'b'e guardá-lo para DF1? eu tentei df1 = df['a':'b'] df1 = df.ix[:, 'a':'b'] Nenhum parece
Quero obter uma lista dos cabeçalhos das colunas de um DataFrame do pandas. O DataFrame virá da entrada do usuário, portanto não saberei quantas colunas haverá ou como serão chamadas. Por exemplo, se eu receber um DataFrame como este: >>> my_dataframe y gdp cap 0 1 2 5 1 2 3 9 2 8 7 2 3...
Eu tentei descobrir uma resposta para essa pergunta por muitos meses enquanto aprendia pandas. Eu uso o SAS no meu trabalho diário e é ótimo pelo suporte fora do núcleo. No entanto, o SAS é horrível como um software por várias outras razões. Um dia, espero substituir meu uso do SAS por python e...
Eu tenho o seguinte DataFrame indexado com colunas e linhas nomeadas, números não contínuos: a b c d 2 0.671399 0.101208 -0.181532 0.241273 3 0.446172 -0.243316 0.051767 1.577318 5 0.614758 0.075793 -0.451460 -0.012493 Gostaria de adicionar uma nova coluna 'e',, ao quadro de dados existente e...
Estou tentando obter o número de linhas do dataframe df com o Pandas, e aqui está o meu código. Método 1: total_rows = df.count print total_rows +1 Método 2: total_rows = df['First_columnn_label'].count print total_rows +1 Ambos os trechos de código me dão este erro: TypeError: tipo (s) de...
Eu tenho o seguinte DataFrame( df): import numpy as np import pandas as pd df = pd.DataFrame(np.random.rand(10, 5)) Eu adiciono mais colunas por atribuição: df['mean'] = df.mean(1) Como posso mover a coluna meanpara a frente, ou seja, defini-la como primeira coluna, deixando a ordem das...
Eu entendo que os pandas são projetados para carregar totalmente preenchidos DataFrame mas preciso criar um DataFrame vazio e adicionar linhas, uma a uma . Qual é a melhor maneira de fazer isso? Criei com sucesso um DataFrame vazio com: res = DataFrame(columns=('lib', 'qty1', 'qty2')) Depois,...
Quero converter uma tabela, representada como uma lista de listas, em um Pandas DataFrame. Como um exemplo extremamente simplificado: a = [['a', '1.2', '4.2'], ['b', '70', '0.03'], ['x', '5', '0']] df = pd.DataFrame(a) Qual é a melhor maneira de converter as colunas nos tipos apropriados, neste...
Eu tenho isso DataFramee quero apenas os registros cuja EPScoluna não é NaN: >>> df STK_ID EPS cash STK_ID RPT_Date 601166 20111231 601166 NaN NaN 600036 20111231 600036 NaN 12 600016 20111231 600016 4.3 NaN 601009 20111231 601009 NaN NaN 601939 20111231 601939 2.5 NaN 000001 20111231...
Eu tenho um quadro de dados em pandas que gostaria de gravar em um arquivo CSV. Estou fazendo isso usando: df.to_csv('out.csv') E recebendo o erro: UnicodeEncodeError: 'ascii' codec can't encode character u'\u03b1' in position 20: ordinal not in range(128) Existe alguma maneira de contornar...
Eu tenho uma lista de dicionários como este: [{'points': 50, 'time': '5:00', 'year': 2010}, {'points': 25, 'time': '6:00', 'month': "february"}, {'points':90, 'time': '9:00', 'month': 'january'}, {'points_h1':20, 'month': 'june'}] E eu quero transformar isso em pandas DataFrameassim: month...
Eu trabalho muito com Series e DataFrames no terminal. O padrão __repr__para uma série retorna uma amostra reduzida, com alguns valores de cabeça e cauda, mas o restante está ausente. Existe uma maneira embutida de imprimir bonito todo o Series / DataFrame? Idealmente, ele suportaria o...
Alguém pode explicar como esses três métodos de fatiar são diferentes? Eu já vi os documentos e essas respostas , mas ainda me encontro incapaz de explicar como os três são diferentes. Para mim, eles parecem intercambiáveis em grande parte, porque estão nos níveis mais baixos de fatiamento. Por...
fundo Acabei de atualizar meus Pandas de 0.11 para 0.13.0rc1. Agora, o aplicativo está lançando muitos novos avisos. Um deles assim: E:\FinReporter\FM_EXT.py:449: SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame. Try using .loc[row_index,col_indexer] =...
Existe uma maneira de ampliar a exibição da saída no modo interativo ou de execução de script? Especificamente, estou usando a describe()função em um panda DataFrame. Quando DataFrametem 5 colunas (rótulos) de largura, recebo as estatísticas descritivas que desejo. No entanto, se DataFrametiver...
Eu tenho o seguinte DataFrame: daysago line_race rating rw wrating line_date 2007-03-31 62 11 56 1.000000 56.000000 2007-03-10 83 11 67 1.000000 67.000000 2007-02-10 111 9 66 1.000000 66.000000 2007-01-13 139 10 83 0.880678 73.096278 2006-12-23 160 10 88 0.793033 69.786942 2006-11-09 204...