],
[5,6,7,8],
[9,10,11,12]
])
#获取行号是0,列号是2的元素a[0,2]
a[0,2]
#获取第一行,0前面要加逗号,不然打印类型出来
a[:,0]...']
salesDf['商品名称']
#通过列表来选择某几列的数据
salesDf[['商品名称','销售数量']]
#通过切片功能,获取指定范围的列
salesDf.loc[:,'购药时间':'销售数量...(5)
#有多少行,多少列
salesDf.shape
#查看每一列的数据类型
salesDf.dtypes
2.数据清洗
1)选择子集(本案例不需要选择子集)
subSalesDf=salesDf.loc...值
2)在pandas中,将缺失值表示为NA,表示不可用not available。.../pandas-docs/stable/generated/pandas.DataFrame.dropna.html
#删除列(销售时间,社保卡号)中为空的行
#how='any' 在给定的任何一列中有缺失值就删除