groupby的操作过程如下
split, 第一步,根据某一个或者多个变量的组合,将输入数据分成多个group
apply, 第二步, 对每个group对应的数据进行处理
combine, 第三步...>>> df.groupby('class')
# 多个列标签的组合,用列表的形式声明
>>> df.groupby(['class','sex'])
# 用行标签分组
>>> arrays =...>>> df.groupby('x').agg(min=('y', 'min'), max=('y', 'max'))
min max
x
a 2 4
b 0 5
c 5 10
# 不同列用不同函数进行处理...>>> df.groupby('x').agg(min=('y', 'min'), max=('z', 'max'))
min max
x
a 2 4.0
b 0 4.2
c 5 4.7
# 不同列用不同函数进行处理...())
y
0 0
1 2
2 -2
3 3
4 3
5 8
pandas中的groupby功能非常的灵活强大,可以极大提高数据处理的效率。