Perguntas com a marcação «pandas»

94
Qual é a diferença entre pandas.qcut e pandas.cut?

A documentação diz: http://pandas.pydata.org/pandas-docs/dev/basics.html "Valores contínuos podem ser discretizados usando as funções cut (bins baseados em valores) e qcut (bins baseados em quantis de amostra)" Parece muito abstrato para mim ... posso ver as diferenças no exemplo abaixo, mas o...

93
Convertendo Django QuerySet em pandas DataFrame

Vou converter um Django QuerySet em um pandas da DataFrameseguinte maneira: qs = SomeModel.objects.select_related().filter(date__year=2012) q = qs.values('date', 'OtherField') df = pd.DataFrame.from_records(q) Funciona, mas existe uma maneira mais eficiente?

93
Adicionar meta-informação / metadados ao pandas DataFrame

É possível adicionar alguma meta-informação / metadados a um DataFrame do pandas? Por exemplo, o nome do instrumento usado para medir os dados, o instrumento responsável, etc. Uma solução alternativa seria criar uma coluna com essas informações, mas parece um desperdício armazenar uma única...

92
Pandas agregam contagem distinta

Digamos que eu tenha um log de atividade do usuário e desejo gerar um relatório de duração total e o número de usuários únicos por dia. import numpy as np import pandas as pd df = pd.DataFrame({'date': ['2013-04-01','2013-04-01','2013-04-01','2013-04-02', '2013-04-02'], 'user_id': ['0001',...

92
seleção de pandas com vários índices

Eu tenho um quadro de dados de vários índices com colunas 'A' e 'B'. Existe uma maneira de selecionar linhas filtrando em uma coluna do multi-índice sem redefinir o índice para um índice de coluna única? Por exemplo. # has multi-index (A,B) df #can I do this? I know this doesn't work...

91
DataFrame grande e persistente em pandas

Estou explorando a mudança para python e pandas como um usuário SAS de longa data. No entanto, ao executar alguns testes hoje, fiquei surpreso que python ficou sem memória ao tentar pandas.read_csv()um arquivo csv de 128 MB. Ele tinha cerca de 200.000 linhas e 200 colunas de dados principalmente...

91
Salvar lista de DataFrames em planilha Excel multisheet

Como posso exportar uma lista de DataFrames para uma planilha do Excel? Os documentos para o to_excelestado: Observações Se passar um objeto ExcelWriter existente, a planilha será adicionada à pasta de trabalho existente. Isso pode ser usado para salvar diferentes DataFrames em uma pasta...

91
Como classificar um DataFrame Pandas por índice?

Quando há um DataFrame como o seguinte: import pandas as pd df = pd.DataFrame([1, 1, 1, 1, 1], index=[100, 29, 234, 1, 150], columns=['A']) Como posso classificar esse dataframe por índice com cada combinação de índice e valor de coluna intacta?