Eu tenho um quadro de dados como A B C 1 nan nan 2 nan 5 3 3 nan 4 nan nan Como preencher apenas os NULLs (com 0) para cada série até o primeiro valor não NULL, levando a A B C 1 0 0 2 0 5 3 3 nan 4 nan
Eu tenho um quadro de dados como A B C 1 nan nan 2 nan 5 3 3 nan 4 nan nan Como preencher apenas os NULLs (com 0) para cada série até o primeiro valor não NULL, levando a A B C 1 0 0 2 0 5 3 3 nan 4 nan
Considere o quadro de dados df df = pd.DataFrame(dict(A=[1, 2], B=['X', 'Y'])) df A B 0 1 X 1 2 Y Se eu mudar axis=0(o padrão) df.shift() A B 0 NaN NaN 1 1.0 X Empurra todas as linhas para baixo uma linha, conforme o esperado. Mas quando eu mudo axis=1 df.shift(axis=1) A B 0 NaN NaN 1...
Oi Eu tenho pesquisado os métodos concat, join e merge para pandas e parece que não consigo encontrar o que quero. Vamos supor que eu tenho dois quadros de dados A = pd.DataFrame("A",index=[0,1,2,3,4],columns=['Col 1','Col 2','Col 3']) B = pd.DataFrame("B",index=[0,1,2,3,4],columns=['Col...
Eu tenho o quadro de dados nesta forma: A B C D E 213-1 XL NaN NaN NaN 21 22.0 12 232.0 101.32 23-0 L NaN NaN NaN 12 23 12 232.2 NaN 31-0 LS NaN NaN NaN 70 70 23 NaN 21.22 Gostaria de mover cada segunda linha desse quadro de dados para a linha acima, para que restem apenas linhas...
Eu tenho abaixo do Dataframe com o campo 'Idade', precisa encontrar a idade mínima 3 entre os DataFrame DF = pd.DataFrame.from_dict({'Name':['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J'], 'Age':[18, 45, 35, 70, 23, 24, 50, 65, 18, 23]}) DF['Age'].min() Quer as duas principais idades, ou...
Eu estou tentando configurar uma subclasse de pd.DataFrameque tem dois argumentos necessários ao inicializar ( groupe timestamp_col). Quero executar a validação nesses argumentos groupe timestamp_col, portanto, tenho um método setter para cada uma das propriedades. Isso tudo funciona até eu tentar...
Eu tenho o seguinte exemplo dataframe: df = pd.DataFrame(data = {'RecordID' : [1,1,1,1,1,2,2,2,2,3,3,3,3,4,4,4,4,5,5,5,5], 'DisplayLabel' : ['Source','Test','Value 1','Value 2','Value3','Source','Test','Value 1','Value 2','Source','Test','Value 1','Value 2','Source','Test','Value 1','Value...
Estou recebendo o erro acima quando tento usar o atributo .ix de um dataframe do pandas para extrair uma coluna, por exemplo, df.ix [:, 'col_header']. O script funcionou a partir desta manhã, mas esta tarde eu o executei em um novo ambiente Linux com uma nova instalação do Pandas. Alguém já viu...
Estou lidando com um DataFrame do Pandas bastante grande - meu conjunto de dados se parece com a seguinte dfconfiguração: import pandas as pd import numpy as np #--------------------------------------------- SIZING PARAMETERS : R1 = 20 # .repeat( repeats = R1 ) R2 = 10 # .repeat( repeats = R2...
Eu obtive a saída, mas tentando encontrar uma maneira mais eficiente de fazer isso: (df['budget'] == 0).sum(), (df['revenue'] == 0).sum(),(df['budget_adj'] == 0).sum(), (df['revenue_adj'] == 0).sum() Saída é (5674, 5993, 5676,
código a seguir está me dando erro. import pandas as pd df = pd.DataFrame({'a' : [1,2,3]}) df.to_hdf('temp.h5', key='df', mode='w') Isso está me dando erro. 'Tabelas' de dependência opcionais ausentes. Use pip ou conda para instalar tabelas. Eu já tentei o ImportError HDFStore requer...
Eu sou bastante novo em python e pandas, então peço desculpas por quaisquer futuros mal-entendidos. Eu tenho um DataFrame pandas com valores horários, parecido com isto: 2014-04-01 09:00:00 52.9 41.1 36.3 2014-04-01 10:00:00 56.4 41.6 70.8 2014-04-01 11:00:00 53.3 41.2 49.6 2014-04-01 12:00:00...
Eu tenho um DataFrame com valores organizados em duas colunas, consulte a tabela T1 . Deseja reorganizar os valores de forma a criar o layout dos dados, conforme mostrado na tabela T2 . Fileiras em T2 são criados por transposição de uma "janela deslizante" de valores, que se deslocam para baixo na...
Digamos que eu tenho o seguinte quadro de dados: a = [[1,2,3,4,5,6],[23,23,212,223,1,12]] b = [1,1] df = pd.DataFrame(zip(a,b), columns = ['a', 'b']) E meu objetivo é remover os elementos nas listas da série A que estão na série B. Minha tentativa de fazer isso está abaixo: df['a'] =...
Eu tenho o dataframe assim: x = pd.DataFrame({ 'audio': ['audio1', 'audio1', 'audio2', 'audio2', 'audio3', 'audio3'], 'text': ['text1', 'text2', 'text3', 'text4', 'text5', 'text6'], 'login': ['operator1', 'operator2', 'operator3', 'operator4', 'operator5', 'operator6'] }) Eu estou tentando...
Estou tentando agrupar com base no relacionamento de sequência entre as duas colunas. d = {'df1':[10,20, 30, 60, 70, 40, 30, 70], 'df2':[20, 30, 40, 80, 70, 50, 90, 100]} df = pd.DataFrame(data = d) df df1 df2 0 10 20 1 20 30 2 30 40 3 60 80 4 80 70 5 40 50 6 30 90 7 70 100 Eu estou esperando...
import pandas as pd import numpy as np data = {'Name':['Tom', 'Tom', 'Jack', 'Terry'], 'Age':[20, 21, 19, 18]} df = pd.DataFrame(data) Digamos que eu tenho um quadro de dados que se parece com isso. Estou tentando descobrir como verificar a coluna Nome quanto ao valor 'Tom' e, se a encontrar pela...
Então, digamos que você tenha um processo Python que colete dados em tempo real com cerca de 500 linhas por segundo (isso pode ser paralelizado ainda mais para reduzir para cerca de 50 ps) de um sistema de filas e anexá-lo a DataFrame: rq = MyRedisQueue(..) df = pd.DataFrame() while 1: recv =...
Tenho dados do mercado de ações para uma única segurança que remonta a 20 anos. Os dados estão atualmente em um DataFrame do Pandas, no seguinte formato: O problema é que eu não quero nenhum dado comercial "fora do horário comercial" no meu DataFrame. O mercado em questão está aberto das 9:30 às...