首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Python Pandas中的Group by (多列连接,)

在 Pandas 中,groupby() 函数用于按一个或多个列对 DataFrame 进行分组。当使用多个列进行分组时,可以使用元组 (col1, col2, ...) 的形式来指定多个列。这样做可以将多个列的值组合在一起,形成唯一的组合,然后可以对这些组合进行聚合操作。

假设有一个 DataFrame df,其包含三列数据 A, B, C,如下所示:

代码语言:javascript
复制
   A   B   C
0  1   a  10
1  1   a  20
2  1   b  30
3  2   a  40
4  2   b  50

如果要对 AB 列进行分组,并计算每组的 C 列的平均值,可以使用以下代码:

代码语言:javascript
复制
grouped = df.groupby(('A', 'B'))['C'].mean()
print(grouped)

执行结果为:

代码语言:javascript
复制
A  B
1  a    15.0
   b    30.0
2  a    40.0
   b    50.0
Name: C, dtype: float64

注意,这里的 ('A', 'B') 是一个元组,表示对 AB 列进行分组。在聚合函数中,可以通过 ['C'] 来指定要聚合的列。

除了使用元组进行多列分组外,还可以使用列表实现类似的功能。例如:

代码语言:javascript
复制
grouped = df.groupby(['A', 'B'])['C'].mean()
print(grouped)

输出结果与之前相同。

总之,在 Pandas 中,使用元组或列表形式传递多个列名给 groupby() 函数即可实现多列分组。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

  • 其实你就学不会 Python

    标题党一下,Python 程序员成千上万,当然有很多人学得会。这里说的“你”,是指职场中的非专业人员。 职场人员一般会用 Excel 处理数据,但也会有很多无助的情况,比如复杂计算、重复计算、自动处理等,再遇上个死机没保存,也常常能把人整得崩溃。如果学会了程序语言,这些问题就都不是事了。那么,该学什么呢? 无数培训机构和网上资料都会告诉我们:Python! Python 代码看起来很简单,只要几行就能解决许多麻烦的 Excel 问题,看起来真不错。 但真是如此吗?作为非专业人员,真能用 Python 来协助我们工作吗? 嘿嘿,只是看上去很美! 事实上,Python 并不合适职场人员,因为它太难了,作为职场非专业人员的你就学不会,甚至,Python 的难度可能会大到让你连 Python 为什么会难到学不会的道理都理解不了的地步。

    01
    领券