如何在重新采样Pandas数据框期间创建额外的列？

在重新采样Pandas数据框期间创建额外的列，可以通过使用resample()函数结合apply()函数来实现。resample()函数用于重新采样数据框，而apply()函数可以对每个重新采样的时间段应用自定义的函数。

以下是一个示例代码，展示如何在重新采样期间创建额外的列：

import pandas as pd

# 创建示例数据框
data = {'日期': pd.date_range(start='2022-01-01', end='2022-01-10', freq='D'),
        '销售额': [100, 200, 150, 300, 250, 400, 350, 500, 450, 600]}
df = pd.DataFrame(data)

# 将日期列设置为索引
df.set_index('日期', inplace=True)

# 重新采样为每周数据，同时计算每周的总销售额和平均销售额
resampled_df = df.resample('W').apply(lambda x: pd.Series({'总销售额': x.sum(), '平均销售额': x.mean()}))

# 打印结果
print(resampled_df)

在上述代码中，我们首先创建了一个示例数据框df，其中包含日期和销售额两列。然后，我们将日期列设置为索引，以便进行重新采样。接下来，我们使用resample()函数将数据重新采样为每周数据，并使用apply()函数对每个重新采样的时间段应用一个匿名函数。在匿名函数中，我们使用pd.Series()创建了一个包含两个新列（总销售额和平均销售额）的Series对象。最后，我们将结果存储在resampled_df中并打印出来。

这样，我们就在重新采样期间成功创建了额外的列。根据具体需求，你可以根据自己的业务逻辑在匿名函数中添加更多的列和计算逻辑。

腾讯云相关产品和产品介绍链接地址：