Eu tenho um campo em um DataFrame do pandas que foi importado como formato de string. Deve ser uma variável datetime. Como faço para convertê-lo em uma coluna datetime e depois filtrar com base na data.
Exemplo:
- Nome do DataFrame: raw_data
- Nome da coluna: Mycol
- Formato do valor na coluna: '05SEP2014: 00: 00: 00.000'
format
argumento não é obrigatório.to_datetime
é inteligente. Vá em frente e tente sem tentar corresponder seus dados.SettingWithCopyWarning
uso do @ darth-behfans stackoverflow.com/a/42773096/4487805infer_datetime_format=True
também pode aumentar a velocidade de análise de ~ 5-10x (de acordo com os documentos do pandas) se você não incluir uma sequência de formato.Você pode usar o método DataFrame
.apply()
para operar com os valores em Mycol:fonte
Se você tiver mais de uma coluna a ser convertida, faça o seguinte:
fonte
funciona, no entanto, resulta em um aviso Python de que Um valor está tentando ser definido em uma cópia de uma fatia de um DataFrame. Tente usar
.loc[row_indexer,col_indexer] = value
vezEu acho que isso é devido a alguma indexação de encadeamento.
fonte
Use a
to_datetime
função pandas para analisar a coluna como DateTime. Além disso, ao usarinfer_datetime_format=True
, ele detectará automaticamente o formato e converterá a coluna mencionada em DateTime.fonte