Ubah tipe kolom DataFrame dari string ke datetime, format dd / mm / yyyy

Jawaban:

476

Cara termudah adalah menggunakan to_datetime:

df['col'] = pd.to_datetime(df['col'])

Ini juga menawarkan dayfirstargumen untuk kali Eropa (tapi waspadalah ini tidak ketat ).

Ini dia sedang beraksi:

In [11]: pd.to_datetime(pd.Series(['05/23/2005']))
Out[11]:
0   2005-05-23 00:00:00
dtype: datetime64[ns]

Anda dapat melewati format tertentu :

In [12]: pd.to_datetime(pd.Series(['05/23/2005']), format="%m/%d/%Y")
Out[12]:
0   2005-05-23
dtype: datetime64[ns]
Andy Hayden
sumber
terima kasih atas ulangan Anda, dapatkah saya menentukan formatnya? suka '% d /% m /% Y'? sangat dihargai
perigee
2
@shootingstars mungkin melihat stackoverflow.com/questions/13703720/...
Andy Hayden
1
@shootingstars yang melewati array DatetimeIndex(df['col']).to_pydatetime()seharusnya berfungsi.
Andy Hayden
1
Nvm, saya berkomentar terlalu dini. Mencari SettingWithCopyWarningbahan yang cukup
Sundeep
2
@daneshjai double-braces membuat DataFrame (hanya dengan satu kolom) dibandingkan dengan single-braces yang mendapatkan kolom sebagai Seri.
Andy Hayden
36

Jika kolom tanggal Anda adalah string dari format '2017-01-01' Anda dapat menggunakan panda astype untuk mengubahnya menjadi datetime.

df['date'] = df['date'].astype('datetime64[ns]')

atau gunakan datetime64 [D] jika Anda ingin presisi Hari dan bukan nanodetik

print(type(df_launath['date'].iloc[0]))

hasil panen

<class 'pandas._libs.tslib.Timestamp'> sama seperti ketika Anda menggunakan panda.to_datetime

Anda dapat mencobanya dengan format lain lalu '% Y-% m-% d' tetapi setidaknya ini berfungsi.

sigurdb
sumber
2

Jika Anda memiliki campuran format dalam kencan Anda, jangan lupa mengatur infer_datetime_format=Trueagar hidup lebih mudah

df['date'] = pd.to_datetime(df['date'], infer_datetime_format=True)

Sumber: pd.to_datetime

atau jika Anda menginginkan pendekatan yang disesuaikan:

def autoconvert_datetime(value):
    formats = ['%m/%d/%Y', '%m-%d-%y']  # formats to try
    result_format = '%d-%m-%Y'  # output format
    for dt_format in formats:
        try:
            dt_obj = datetime.strptime(value, dt_format)
            return dt_obj.strftime(result_format)
        except Exception as e:  # throws exception when format doesn't match
            pass
    return value  # let it be if it doesn't match

df['date'] = df['date'].apply(autoconvert_datetime)
abhyudayasrinet
sumber