Acho que deve ser simples, mas tentei algumas idéias e nenhuma delas funcionou: last_row = len(DF) DF = DF.drop(DF.index[last_row]) #<-- fail! Tentei usar índices negativos, mas isso também levou a erros. Devo ainda estar entendendo mal algo
Acho que deve ser simples, mas tentei algumas idéias e nenhuma delas funcionou: last_row = len(DF) DF = DF.drop(DF.index[last_row]) #<-- fail! Tentei usar índices negativos, mas isso também levou a erros. Devo ainda estar entendendo mal algo
Eu tenho um DataFrame: import pandas as pd import numpy as np df = pd.DataFrame({'foo.aa': [1, 2.1, np.nan, 4.7, 5.6, 6.8], 'foo.fighters': [0, 1, np.nan, 0, 0, 0], 'foo.bars': [0, 0, 0, 0, 0, 1], 'bar.baz': [5, 5, 6, 5, 5.6, 6.8], 'foo.fox': [2, 4, 1, 0, 0, 5], 'nas.foo': ['NA', 0, 1, 0, 0,...
Tenho dois quadros de dados df1 e df2, onde df2 é um subconjunto de df1. Como obtenho um novo quadro de dados (df3), que é a diferença entre os dois quadros de dados? Em outras palavras, um quadro de dados que possui todas as linhas / colunas em df1 que não estão em df2?
Estou trabalhando com este DataFrame Pandas em Python. File heat Farheit Temp_Rating 1 YesQ 75 N/A 1 NoR 115 N/A 1 YesA 63 N/A 1 NoT 83 41 1 NoY 100 80 1 YesZ 56 12 2 YesQ 111 N/A 2 NoR 60 N/A 2 YesA 19 N/A 2 NoT 106 77 2 NoY 45 21 2 YesZ 40 54 3 YesQ 84 N/A 3 NoR 67 N/A 3 YesA...
Quero ler um arquivo .xlsx usando a biblioteca Pandas do python e transferir os dados para uma tabela postgreSQL. Tudo o que pude fazer até agora é: import pandas as pd data = pd.ExcelFile("*File Name*") Agora eu sei que a etapa foi executada com sucesso, mas eu quero saber como posso analisar...
Eu tenho um DataFrame df: A B a 2 2 b 3 1 c 1 3 Quero criar uma nova coluna com base nos seguintes critérios: se linha A == B: 0 se linhaA > B: 1 se linha A < B: -1 então, dada a tabela acima, deveria ser: A B C a 2 2 0 b 3 1 1 c 1 3 -1 Para if elsecasos típicos que eu faço...
Posso usar a pandas dropna()funcionalidade para remover linhas com algumas ou todas as colunas definidas como NA's. Existe uma função equivalente para descartar linhas com todas as colunas com valor 0? P kt b tt mky depth 1 0 0 0 0 0 2 0 0 0 0 0 3 0 0 0 0 0 4 0 0 0 0 0 5 1.1 3 4.5 2.3 9.0 Neste...
Qual é a melhor maneira de criar um quadro de dados pandas preenchido com zero de um determinado tamanho? Eu tenho usado: zero_data = np.zeros(shape=(len(data),len(feature_list))) d = pd.DataFrame(zero_data, columns=feature_list) Há uma melhor forma de fazê-lo?
Existe o método DataFrame.to_sql , mas funciona apenas para bancos de dados mysql, sqlite e oracle. Não consigo passar para este método de conexão postgres ou motor
Eu tenho um dataframe com este tipo de dados (muitas colunas): col1 int64 col2 int64 col3 category col4 category col5 category As colunas parecem assim: Name: col3, dtype: category Categories (8, object): [B, C, E, G, H, N, S, W] Eu quero converter todos os valores em colunas para inteiros...
Eu tenho esse quadro de dados diamondsque é composto de variáveis como (carat, price, color), e quero desenhar um gráfico de dispersão de pricea caratpara cada um color, o que significa que diferente colortem cores diferentes no gráfico. Isso é fácil Rcom ggplot: ggplot(aes(x=carat, y=price,...
Eu gostaria de mudar uma coluna em um Pandas DataFrame, mas não consegui encontrar um método para fazer isso na documentação sem reescrever todo o DF. Alguém sabe fazer isso? Quadro de dados: ## x1 x2 ##0 206 214 ##1 226 234 ##2 245 253 ##3 265 272 ##4 283 291 Saída desejada: ## x1 x2 ##0 206...
Estou procurando uma maneira de fazer o equivalente ao SQL SELECT DISTINCT col1, col2 FROM dataframe_table A comparação pandas sql não tem nada sobre distinct. .unique() só funciona para uma única coluna, então suponho que poderia concatá-las ou colocá-las em uma lista / tupla e comparar dessa...
Eu tenho um DataFrame com um MultiIndex criado após alguns agrupamentos: import numpy as np import pandas as p from numpy.random import randn df = p.DataFrame({ 'A' : ['a1', 'a1', 'a2', 'a3'] , 'B' : ['b1', 'b2', 'b3', 'b4'] , 'Vals' : randn(4) }).groupby(['A', 'B']).sum() df Output>...
Estou simplesmente tentando acessar colunas nomeadas de pandas por um número inteiro. Você pode selecionar uma linha por localização usando df.ix[3]. Mas como selecionar uma coluna por inteiro? Meu dataframe: df=pandas.DataFrame({'a':np.random.rand(5),
Minhas matrizes numpy usam np.nanpara designar valores ausentes. À medida que faço a iteração no conjunto de dados, preciso detectar esses valores ausentes e tratá-los de maneiras especiais. Usei ingenuamente numpy.isnan(val), o que funciona bem, a menos que valnão esteja entre o subconjunto de...
Eu tenho uma matriz de flutuadores (alguns números normais, alguns nans) que está saindo de um aplicar em um dataframe do pandas. Por alguma razão, numpy.isnan está falhando neste array, no entanto, conforme mostrado abaixo, cada elemento é um float, numpy.isnan é executado corretamente em cada...
Eu enfrento alguns problemas aqui, no meu pacote python eu instalei numpy, mas ainda tenho este erro 'DataFrame' objeto não tem atributo 'sort' Qualquer um pode me dar uma ideia .. Este é o meu código: final.loc[-1] =['', 'P','Actual'] final.index = final.index + 1 # shifting index final =...
Peguei minha série e coagi para uma coluna datetime de dtype = datetime64[ns](embora só precise de resolução de dia ... não tenho certeza de como mudar). import pandas as pd df = pd.read_csv('somefile.csv') column = df['date'] column = pd.to_datetime(column, coerce=True) mas a plotagem não...
Eu sou um pouco novo para os pandas. Eu tenho um quadro de dados do pandas que tem 1 linha por 23 colunas. Eu quero converter isso em uma série? Estou me perguntando qual é a maneira mais python de fazer isso? Já tentei, pd.Series(myResults)mas reclama ValueError: cannot copy sequence with...