,可以使用groupby
函数和transform
函数来实现。
首先,需要将日期列转换为日期类型,可以使用to_datetime
函数将日期列转换为datetime64
类型。假设日期列的名称为date_column
,可以使用以下代码进行转换:
df['date_column'] = pd.to_datetime(df['date_column'])
接下来,可以使用groupby
函数按日期列进行分组,并使用transform
函数保留日期列。假设需要按月份进行分组,可以使用以下代码:
df['grouped_date'] = df.groupby(df['date_column'].dt.to_period('M'))['date_column'].transform('first')
上述代码中,dt.to_period('M')
将日期列转换为月份,并使用first
函数获取每个月份的第一个日期。transform
函数将保留每个分组的日期列。
最后,可以根据需要选择保留的列,可以使用drop
函数删除不需要的列。假设需要保留的列为date_column
和grouped_date
,可以使用以下代码:
df = df.drop(['date_column'], axis=1)
以上就是在pandas中按日期分组保留日期列的方法。
推荐的腾讯云相关产品:腾讯云数据库TDSQL、腾讯云云服务器CVM、腾讯云对象存储COS。
领取专属 10元无门槛券
手把手带您无忧上云