Como posso converter uma coluna DataFrame de seqüências de caracteres (no formato dd / mm / aaaa ) em data / hora?
283
Como posso converter uma coluna DataFrame de seqüências de caracteres (no formato dd / mm / aaaa ) em data / hora?
A maneira mais fácil é usar to_datetime
:
df['col'] = pd.to_datetime(df['col'])
Ele também oferece um dayfirst
argumento para os tempos europeus (mas cuidado, isso não é rigoroso ).
Aqui está em ação:
In [11]: pd.to_datetime(pd.Series(['05/23/2005']))
Out[11]:
0 2005-05-23 00:00:00
dtype: datetime64[ns]
Você pode passar um formato específico :
In [12]: pd.to_datetime(pd.Series(['05/23/2005']), format="%m/%d/%Y")
Out[12]:
0 2005-05-23
dtype: datetime64[ns]
DatetimeIndex(df['col']).to_pydatetime()
deve funcionar.SettingWithCopyWarning
material suficienteSe a sua coluna de data for uma sequência do formato '2017-01-01', você poderá usar o pandas astype para convertê-lo em datetime.
df['date'] = df['date'].astype('datetime64[ns]')
ou use datetime64 [D] se desejar precisão do dia e não nanossegundos
print(type(df_launath['date'].iloc[0]))
rendimentos
<class 'pandas._libs.tslib.Timestamp'>
o mesmo que quando você usa pandas.to_datetimeVocê pode experimentá-lo com outros formatos, em seguida '% Y-% m-% d', mas pelo menos isso funciona.
fonte
Você pode usar o seguinte se desejar especificar formatos complicados:
Mais detalhes
format
aqui:fonte
Se você tem uma mistura de formatos em sua data, não esqueça de definir
infer_datetime_format=True
para facilitar a vidadf['date'] = pd.to_datetime(df['date'], infer_datetime_format=True)
Fonte: pd.to_datetime
ou se você deseja uma abordagem personalizada:
fonte