Converta o tipo de coluna DataFrame de string para datetime, formato dd / mm / aaaa

Respostas:

474

A maneira mais fácil é usar to_datetime:

df['col'] = pd.to_datetime(df['col'])

Ele também oferece um dayfirstargumento para os tempos europeus (mas cuidado, isso não é rigoroso ).

Aqui está em ação:

In [11]: pd.to_datetime(pd.Series(['05/23/2005']))
Out[11]:
0   2005-05-23 00:00:00
dtype: datetime64[ns]

Você pode passar um formato específico :

In [12]: pd.to_datetime(pd.Series(['05/23/2005']), format="%m/%d/%Y")
Out[12]:
0   2005-05-23
dtype: datetime64[ns]
Andy Hayden
fonte
obrigado pelo seu replay, posso definir seu formato? como '% d /% m /% Y'? muito apreciado
perigee
2
@shootingstars talvez veja stackoverflow.com/questions/13703720/… #
Andy Hayden #
1
@shootingstars passando a matriz DatetimeIndex(df['col']).to_pydatetime()deve funcionar.
Andy Hayden
1
Nvm, comentei muito cedo. Procurando por SettingWithCopyWarningmaterial suficiente
Sundeep 09/02
2
As chaves duplas do @daneshjai formam um DataFrame (com apenas uma coluna) em comparação com chaves simples, que obtém a coluna como uma série.
Andy Hayden
36

Se a sua coluna de data for uma sequência do formato '2017-01-01', você poderá usar o pandas astype para convertê-lo em datetime.

df['date'] = df['date'].astype('datetime64[ns]')

ou use datetime64 [D] se desejar precisão do dia e não nanossegundos

print(type(df_launath['date'].iloc[0]))

rendimentos

<class 'pandas._libs.tslib.Timestamp'> o mesmo que quando você usa pandas.to_datetime

Você pode experimentá-lo com outros formatos, em seguida '% Y-% m-% d', mas pelo menos isso funciona.

sigurdb
fonte
2

Se você tem uma mistura de formatos em sua data, não esqueça de definir infer_datetime_format=Truepara facilitar a vida

df['date'] = pd.to_datetime(df['date'], infer_datetime_format=True)

Fonte: pd.to_datetime

ou se você deseja uma abordagem personalizada:

def autoconvert_datetime(value):
    formats = ['%m/%d/%Y', '%m-%d-%y']  # formats to try
    result_format = '%d-%m-%Y'  # output format
    for dt_format in formats:
        try:
            dt_obj = datetime.strptime(value, dt_format)
            return dt_obj.strftime(result_format)
        except Exception as e:  # throws exception when format doesn't match
            pass
    return value  # let it be if it doesn't match

df['date'] = df['date'].apply(autoconvert_datetime)
abhyudayasrinet
fonte