python的pandas库可以轻松的处理excel中比较难实现的筛选功能,以下简单的介绍几种利用pandas实现筛选功能方式:
pandas——专为解决数据分析与处理任务而创建的。
引入模块:
import pandas as pd
,导入 pandas
包;df=pd.read_excel('data.elsx',sheet_name=''sheet1")
,加载 Excel 数据;sheet_name
指定读取哪个工作表、也可以写为sheet_name=0
data=df.loc[2:5] #这里的[2:5]表示第3行到第5行内容,[]第一个起始是0,表示数据的第一行
df['列名'] = '值'
data_many=df[(df['列名1']== ‘列值1’)&(df['列名2']==‘列值2’)]
data_many="列名 in [‘值1’,‘值2’,......]"
是不是很像SQL的语句:select * from id where name in (‘值1’,‘值2’,‘值3’)
某列中开头是某值,中间包含某值的模式匹配法,可能在Excel中实现比较困难,但是python就非常简单了。
自定义函数获取返回函数值——cond
cond=df['列名'].str.startswith('值')
cond=df['列名'].str.contains('值')
筛选出基于两个值之间的数据:
自定义函数cond
cond=df[(df['列名1']>‘列值1’)&(df['列名1']<‘列值2’)]
返回列名1介于列值1和列值2之间的数据