前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Pandas实现简单筛选数据功能

Pandas实现简单筛选数据功能

作者头像
kirin
发布2021-03-11 14:24:24
1.5K0
发布2021-03-11 14:24:24
举报
文章被收录于专栏:Kirin博客

一、简述

python的pandas库可以轻松的处理excel中比较难实现的筛选功能,以下简单的介绍几种利用pandas实现筛选功能方式:

二、模块介绍

pandas——专为解决数据分析与处理任务而创建的。

引入模块:

  • import pandas as pd ,导入 pandas 包;
  • df=pd.read_excel('data.elsx',sheet_name=''sheet1"),加载 Excel 数据;
  • 指定文件路径,由于文件在 Python 脚本同目录,直接输入文件名即可
  • sheet_name 指定读取哪个工作表、也可以写为sheet_name=0

三、样例

3.1 简单查询

  1. 筛选出数据的指定几行数据 自定义函数变量data
代码语言:javascript
复制
data=df.loc[2:5] #这里的[2:5]表示第3行到第5行内容,[]第一个起始是0,表示数据的第一行
  1. 筛选出数据某列为某值的所有数据记录
代码语言:javascript
复制
df['列名'] = '值'
  1. 多条件匹配时 自定义函数data_many
代码语言:javascript
复制
 data_many=df[(df['列名1']== ‘列值1’)&(df['列名2']==‘列值2’)]
  1. 多值匹配时
代码语言:javascript
复制
 data_many="列名 in [‘值1’,‘值2’,......]"

是不是很像SQL的语句:select * from id where name in (‘值1’,‘值2’,‘值3’)

3.2 模式匹配

某列中开头是某值,中间包含某值的模式匹配法,可能在Excel中实现比较困难,但是python就非常简单了。

自定义函数获取返回函数值——cond

  1. 开头包含某值的模式匹配
代码语言:javascript
复制
cond=df['列名'].str.startswith('值')
  1. 中间包含某值的模式匹配
代码语言:javascript
复制
cond=df['列名'].str.contains('值')

3.3 范围区间值筛选

筛选出基于两个值之间的数据:

自定义函数cond

代码语言:javascript
复制
cond=df[(df['列名1']>‘列值1’)&(df['列名1']<‘列值2’)]

返回列名1介于列值1和列值2之间的数据

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2021/03/05 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、简述
  • 二、模块介绍
  • 三、样例
    • 3.1 简单查询
      • 3.2 模式匹配
        • 3.3 范围区间值筛选
        领券
        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档