Perguntas com a marcação «pandas»

15
Encontre pares simétricos rapidamente em numpy

from itertools import product import pandas as pd df = pd.DataFrame.from_records(product(range(10), range(10))) df = df.sample(90) df.columns = "c1 c2".split() df = df.sort_values(df.columns.tolist()).reset_index(drop=True) # c1 c2 # 0 0 0 # 1 0 1 # 2 0 2 # 3 0 3 # 4 0 4 # .. .. .. # 85 9 4 # 86 9...

14
Inferir quais colunas são datetime

Eu tenho um enorme quadro de dados com muitas colunas, muitas das quais são do tipo datetime.datetime. O problema é que muitos também têm tipos mistos, incluindo, por exemplo, datetime.datetimevalores e Nonevalores (e potencialmente outros valores inválidos): 0 2017-07-06 00:00:00 1 2018-02-27...

13
Pandas lentos DataFrame MultiIndex reindex

Eu tenho um DataFrame de pandas do formulário: id start_time sequence_no value 0 71 2018-10-17 20:12:43+00:00 114428 3 1 71 2018-10-17 20:12:43+00:00 114429 3 2 71 2018-10-17 20:12:43+00:00 114431 79 3 71 2019-11-06 00:51:14+00:00 216009 100 4 71 2019-11-06 00:51:14+00:00 216011 150 5 71...

12
Gerar produtos cartesianos binários filtrados

Declaração do problema Estou procurando uma maneira eficiente de gerar produtos cartesianos binários completos (tabelas com todas as combinações de True e False com um certo número de colunas), filtradas por determinadas condições exclusivas. Por exemplo, para três colunas / bits n=3obteríamos a...

11
crie uma matriz NxN a partir de uma coluna pandas

Eu tenho dataframe com cada linha com um valor de lista. id list_of_value 0 ['a','b','c'] 1 ['d','b','c'] 2 ['a','b','c'] 3 ['a','b','c'] eu tenho que fazer um cálculo de uma pontuação com uma linha e contra todas as outras linhas Por exemplo: Step 1: Take value of id 0: ['a','b','c'], Step 2:...