Perguntas com a marcação «pandas»

98
Pandas Como filtrar uma série

Eu tenho uma série como esta depois de fazer groupby ('nome') e usar a função mean () em outra coluna name 383 3.000000 663 1.000000 726 1.000000 737 9.000000 833 8.166667 Alguém poderia me mostrar como filtrar as linhas com valores médios de 1.000000? Obrigado e agradeço muito sua ajuda....

98
Fazer Pandas DataFrame apply () usar todos os núcleos?

Em agosto de 2017, o Pandas DataFame.apply () infelizmente ainda está limitado a trabalhar com um único núcleo, o que significa que uma máquina com vários núcleos vai desperdiçar a maior parte do seu tempo de computação quando você executa df.apply(myfunc, axis=1). Como você pode usar todos os...

97
python-pandas e bancos de dados como mysql

A documentação do Pandas contém vários exemplos de práticas recomendadas para trabalhar com dados armazenados em vários formatos. No entanto, não consigo encontrar bons exemplos para trabalhar com bancos de dados como o MySQL, por exemplo. Alguém pode me apontar para links ou dar alguns trechos...

97
pandas read_csv e colunas de filtro com usecols

Tenho um arquivo csv que não está chegando corretamente pandas.read_csvquando filtro as colunas usecolse uso vários índices. import pandas as pd csv = r"""dummy,date,loc,x bar,20090101,a,1 bar,20090102,a,3 bar,20090103,a,5 bar,20090101,b,1 bar,20090102,b,3 bar,20090103,b,5""" f =...

97
Como importar dados de mongodb para pandas?

Eu tenho uma grande quantidade de dados em uma coleção no mongodb que preciso analisar. Como faço para importar esses dados para o pandas? Eu sou novo em pandas e entorpecido. EDITAR: A coleção mongodb contém valores de sensor marcados com data e hora. Os valores do sensor são do tipo de dados...

97
Pular linhas durante a importação csv dos pandas

Estou tentando importar um arquivo .csv usando pandas.read_csv(), mas não quero importar a 2ª linha do arquivo de dados (a linha com índice = 1 para indexação 0). Não consigo ver como não importá-lo porque os argumentos usados ​​com o comando parecem ambíguos: Do site do pandas: skiprows :...

97
Pandas groupby soma cumulativa

Eu gostaria de adicionar uma coluna de soma cumulativa ao meu dataframe do Pandas para que: name | day | no -----|-----------|---- Jack | Monday | 10 Jack | Tuesday | 20 Jack | Tuesday | 10 Jack | Wednesday | 50 Jill | Monday | 40 Jill | Wednesday | 110 torna-se: Jack | Monday | 10 | 10 Jack...

97
Como definir uma célula para NaN em um dataframe do pandas

Eu gostaria de substituir valores inválidos em uma coluna de um dataframe por NaN's. mydata = {'x' : [10, 50, 18, 32, 47, 20], 'y' : ['12', '11', 'N/A', '13', '15', 'N/A']} df = pd.DataFrame(mydata) df[df.y == 'N/A']['y'] = np.nan Porém, a última linha falha e gera um aviso porque está...

96
Pandas Merge - Como evitar colunas duplicadas

Estou tentando uma fusão entre dois quadros de dados. Cada quadro de dados tem dois níveis de índice (data, cúspide). Nas colunas, algumas colunas correspondem entre os dois (moeda, data de ajuste), por exemplo. Qual é a melhor maneira de mesclar estes por índice, mas não levar duas cópias da...