上述例子在python中的实现过程如下
>>> import numpy as np
>>> import pandas as pd
>>> df = pd.DataFrame({'x':['a','a...groupby函数的返回值为为DataFrameGroupBy对象,有以下几个基本属性和方法
>>> grouped = df.groupby('x')
>>> grouped
pandas.core.groupby.generic.DataFrameGroupBy...通过aggregate方法则可以灵活的使用各种函数,用法如下
>>> df = pd.DataFrame({'x':['a','a','b','b','c','c'],'y':[2,4,0,5,5,10...]})
# 一次使用一个函数进行处理
>>> df.groupby('x').aggregate(np.mean)
y
x
a 3.0
b 2.5
c 7.5
# agg是aggregate的简写...汇总数据
transform方法返回一个和输入的原始数据相同尺寸的数据框,常用于在原始数据框的基础上增加新的一列分组统计数据,用法如下
>>> df = pd.DataFrame({'x':['a','