=[True,False]) #先按列col1升序排列,后按col2降序排列数据
df.groupby(col) # 返回一个按列col进行分组的Groupby对象
df.groupby([col1,col2...]) # 返回一个按多列进行分组的Groupby对象
df.groupby(col1)[col2].agg(mean) # 返回按列col1进行分组后,列col2的均值,agg可以接受列表参数,agg(...[len,np.mean])
df.pivot_table(index=col1, values=[col2,col3], aggfunc={col2:max,col3:[ma,min]}) # 创建一个按列...=1) # 对DataFrame中的每一行应用函数np.max
df.groupby(col1).col2.transform("sum") # 通常与groupby连用,避免索引更改
数据合并
df1...,会报错,可通过设置lsuffix,rsuffix来进行解决,如果需要按照共同列进行合并,就要用到set_index(col1)
pd.merge(df1,df2,on='col1',how='outer