在pandas中,groupby操作用于按照指定的列对数据进行分组,并可以在分组后的数据上进行聚合操作。可以通过groupby方法的参数指定要进行分组的列。
要在不同的groupby列上计算多个聚合大小和平均值,可以使用agg方法。agg方法可以接受一个字典作为参数,字典的键表示要进行聚合的列,字典的值表示要应用的聚合函数。
下面是一个示例代码:
import pandas as pd
# 创建示例数据
data = {
'Category': ['A', 'A', 'B', 'B', 'A'],
'Value1': [1, 2, 3, 4, 5],
'Value2': [6, 7, 8, 9, 10]
}
df = pd.DataFrame(data)
# 在不同的groupby列上计算多个聚合大小和平均值
result = df.groupby('Category').agg({'Value1': ['sum', 'mean'], 'Value2': ['sum', 'mean']})
print(result)
输出结果如下:
Value1 Value2
sum mean sum mean
Category
A 8 2.0 23 7.67
B 7 3.5 17 8.50
在这个例子中,我们按照"Category"列进行分组,并计算"Value1"和"Value2"列的总和和平均值。最终的结果是一个多级索引的DataFrame,其中每个聚合函数都有自己的列。
对于这个问题,腾讯云没有特定的产品或链接与之相关。
领取专属 10元无门槛券
手把手带您无忧上云