Perguntas com a marcação «pandas»

87
extração de dias de um valor numpy.timedelta64

Estou usando o pandas / python e tenho duas séries de tempo de data s1 e s2, que foram geradas usando a função 'to_datetime' em um campo do df contendo datas / horas. Quando eu subtraio s1 de s2 s3 = s2 - s1 Eu recebo uma série, s3, do tipo timedelta64 [ns] 0 385 days, 04:10:36 1 57...

87
Como excluo uma coluna que contém apenas zeros no Pandas?

Atualmente, tenho um dataframe que consiste em colunas com valores de 1 e 0, gostaria de iterar pelas colunas e excluir aquelas que são compostas de apenas 0s. Aqui está o que tentei até agora: ones = [] zeros = [] for year in years: for i in range(0,599): if year[str(i)].values.any() == 1:...

87
Como definir alguns xlim e ylim em Seaborn lmplot facetgrid

Estou usando o lmplot do Seaborn para traçar uma regressão linear, dividindo meu conjunto de dados em dois grupos com uma variável categórica. Para xey, gostaria de definir manualmente o limite inferior em ambos os gráficos, mas deixar o limite superior no padrão Seaborn. Aqui está um exemplo...

87
Aplicar função a cada célula no DataFrame

Eu tenho um dataframe que pode ser parecido com este: A B C foo bar foo bar bar foo foo bar Quero examinar cada elemento de cada linha (ou cada elemento de cada coluna) e aplicar a seguinte função para obter o DF subsequente: def foo_bar(x): return x.replace('foo', 'wow') A B C wow bar wow...

86
pandas: filtro complexo em linhas de DataFrame

Eu gostaria de filtrar linhas por uma função de cada linha, por exemplo def f(row): return sin(row['velocity'])/np.prod(['masses']) > 5 df = pandas.DataFrame(...) filtered = df[apply_to_all_rows(df, f)] Ou para outro exemplo mais complexo e inventado, def g(row): if

86
Divida um grande dataframe do pandas

Eu tenho um grande dataframe com 423244 linhas. Eu quero dividir isso em 4. Tentei o código a seguir, mas deu um erro?ValueError: array split does not result in an equal division for item in np.split(df, 4): print item Como dividir esse dataframe em 4 grupos?

86
Mudar coluna em um dataframe do pandas?

Eu tenho um dataframe do pandas. Eu quero 'retardar' uma de minhas colunas. Isso significa, por exemplo, deslocar a coluna inteira 'gdp' para cima em um e, em seguida, remover todos os dados em excesso na parte inferior das linhas restantes para que todas as colunas tenham o mesmo comprimento...

25
Bug estranho em Pandas e Numpy em relação a multithreading

A maioria das funções do Numpy habilitará multithreading por padrão. por exemplo, eu trabalho em uma estação de trabalho intel cpu de 8 núcleos, se eu executar um script import numpy as np x=np.random.random(1000000) for i in range(100000): np.sqrt(x) o linux topmostrará 800% de uso da CPU...

19
Desempilhar e retornar o valor conta para cada variável?

Eu tenho um quadro de dados que registra respostas da escolha de 19717 pessoas das linguagens de programação por meio de perguntas de múltipla escolha. A primeira coluna é, obviamente, o sexo do entrevistado, enquanto o restante são as escolhas que eles escolheram. E, portanto, se eu escolher o...

16
Como converter panda dataframe em dicionário hierárquico

Eu tenho o seguinte quadro de dados de pandas: df1 = pd.DataFrame({'date': [200101,200101,200101,200101,200102,200102,200102,200102],'blockcount': [1,1,2,2,1,1,2,2],'reactiontime': [350,400,200,250,100,300,450,400]}) Estou tentando criar um dicionário hierárquico, com os valores do dicionário...