在pandas中,可以使用str.extract()
方法从列中提取任意格式的日期。str.extract()
方法使用正则表达式来匹配并提取字符串中的模式。
以下是一个示例代码,演示如何从pandas列中提取任意格式的日期:
import pandas as pd
# 创建一个包含日期的示例数据
data = {'date_column': ['Today is 2022-01-01', 'The event will happen on 2022-02-15', '2022/03/20 is an important date']}
df = pd.DataFrame(data)
# 使用正则表达式从列中提取日期
df['extracted_date'] = df['date_column'].str.extract(r'(\d{4}-\d{2}-\d{2}|\d{4}/\d{2}/\d{2})')
# 打印提取后的结果
print(df['extracted_date'])
输出结果如下:
0 2022-01-01
1 2022-02-15
2 2022/03/20
Name: extracted_date, dtype: object
在上述代码中,我们首先创建了一个包含日期的示例数据。然后,使用str.extract()
方法和正则表达式(\d{4}-\d{2}-\d{2}|\d{4}/\d{2}/\d{2})
从date_column
列中提取日期。提取后的结果存储在新的列extracted_date
中。最后,我们打印了提取后的结果。
这种方法适用于提取任意格式的日期,只需要根据实际情况调整正则表达式的模式。如果需要提取其他格式的日期,只需修改正则表达式即可。
腾讯云相关产品和产品介绍链接地址:
领取专属 10元无门槛券
手把手带您无忧上云