好, 下面看一下 crosstab 的功力:
pd.crosstab(df.Nationality, df.Handedness)
输出:
?...还可以添加第三个参数:
pd.crosstab(df.Sex, df.Handedness, margins = True)
输出:
?...同时, 行和列都可以是复合的:
pd.crosstab(df.Sex, [df.Handedness, df.Nationality], margins = True)
输出:
?...:
pd.crosstab(df.Sex, df.Handedness, normalize='index')
输出:
?...求指定列的平均值:
import numpy as np
pd.crosstab(df.Sex, df.Handedness, values=df.Age, aggfunc=np.average)
输出