使用标签选取数据:
df.loc[行标签,列标签]df.loc['a':'b']#选取ab两行数据df.loc[:,'one']#选取one列的数据
df.loc的第一个参数是行标签,第二个参数为列标签...使用位置选取数据:
df.iloc[行位置,列位置]df.iloc[1,1]#选取第二行,第二列的值,返回的为单个值df.iloc[0,2],:]#选取第一行及第三行的数据df.iloc[0:2,:]#...的缩写,iloc则为integer & location的缩写
更广义的切片方式是使用.ix,它自动根据你给到的索引类型判断是使用位置还是标签进行切片
df.ix[1,1]df.ix['a':'b']...DataFrame的每一列,这里使用的是匿名lambda函数,与R中apply函数类似
设置索引
df.set_index('one')
重命名列
df.rename(columns={u'one':'...,以C为列标签将D列的值汇总求和pd.crosstab(rows = ['A', 'B'], cols = ['C'], values = 'D')#以A、B为行标签,以C为列标签将D列的值汇总求和