首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

懂Excel就能轻松入门pandas(一):筛选功能

后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器—— pandas 。 Excel 自带筛选功能,可以对表格中进行各种条件筛选。...今天我们就用 pandas 看看怎么做到 Excel 的筛选功能,并且看看 Excel 也做不到的功能。...看图: - 为了与 pandas 行索引保持一致,这里添加的列值是从0开始 接着试试,"显示第3至6行",如下: - 功能卡"数据"页面,在"排序和筛选"中点击大大的"筛选"图标 - 点首行第一列的下角标签...Excel 中的筛选也是强大的,直接有此功能。...Excel 上操作也简单,不再展示。 再看看这个需求。 "出生在 1980至1990 之间的男性" 冰山一角 Excel 的筛选功能无疑是强大的,不过 pandas 也很厉害。

5.7K20
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    对比Excel,更强大的Python pandas筛选(续)

    标签:Python与Excel,pandas 接着《对比Excel,更强大的Python pandas筛选》,我们继续讲解pandas数据框架中的高级筛选,涉及到OR、AND、NOT逻辑。...首先,我们激活pandas并从百度百科加载数据。下面附上了数据表的屏幕截图,以便于参考。...import pandas as pd df = pd.read_html('https://baike.baidu.com/item/%E4%B8%96%E7%95%8C500%E5%BC%BA/640042...下面是一个简化的Excel示例,演示|运算符的含义。 图3 交集 当需要满足两个(或更多)条件时,使用AND逻辑。例如,我们可以了解有多少中国500强公司的利润大于500亿美元。...下面的Excel示例显示了&的含义。 图5 相反 要选择相反面,我们需要使用NOT逻辑运算符。按位NOT是“~”。下面是一个Excel示例。

    94240

    懂Excel轻松入门Python数据分析包pandas(29):轻松做出筛选控件

    后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器—— pandas 前言 本系列介绍了许多类比 Excel 的 pandas 操作,确实他们都能很好对应起来,这是因为 pandas...本身是以行列表作为核心概念,比如说 Excel 中的透视表,在 pandas 中就有一一对应,本系列已经讲解过。...Excel 的操作便利性在于只需要鼠标点击就可以完成操作,这对于查看数据是非常方便。 难道我们用 Python 就不能做到吗?本文将结合一些工具,使得你的 pandas 处理过程变得灵活动态。...年份有4种选择,此时界面上看到一个 year 的下拉框供用户点选 topn=range(1,11) ,topn 有10种选择,界面同样可以看到下拉框 现在,我们只需要简单从下拉框选择条件值,下方的结果会马上刷新...,这与 Excel 中的透视表一模一样 不过,大家都知道 Excel 中还能根据透视表制作透视图,这里我们同样可以制作出动态变化的图表: 行13,14:使用 display 方法,输出内容即可 --

    94120

    ,当Pandas遇上Excel会擦出什么样的火花呢?!

    Excel是我们职场打工人接触最多的办公室软件之一,当中会涉及到很多重复的操作,好在Python为我们提供了很多操作Excel的模块,能够帮助我们极大地提高工作效率,从琐碎的工作时间中抽出身来。...表格当中 当我们用pandas模块对Excel表格进行处理的时候,需要引用xlsxwriter模块作为内在的引擎。...我们来实现一下如何将多个DataFrame数据保存在一张Excel表格当中,并且分成不同的sheet import pandas as pd # 创建几个DataFrame数据集 df1 = pd.DataFrame....to_excel(writer, sheet_name='Sheet2') df3.to_excel(writer, sheet_name='Sheet3') # 输出生成的Excel文件 writer.save...False, index=False) writer.save() 如下图所示 针对表格中的数据绘制直方图 下面我们来看一下,如何利用Pandas来根据表格中的数据绘制柱状图,并且保存在Excel

    1.2K40

    懂Excel也能轻松入门Python数据分析包pandas(二):高级筛选(下)

    系列文章: -懂Excel也能轻松入门Python数据分析包pandas(二):高级筛选(上) 前言 经常听别人说 Python 在数据领域有多厉害,结果学了很长时间,连数据处理都麻烦得要死。...后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器—— pandas 。 紧接着上一篇的高级筛选,不过上一篇的例子太简单了,这次来点难度。...数据 继续沿用上一篇的数据: - 某学校的一份考试成绩表(8科成绩) 加载数据 pandas 需要加载 Excel 数据,如下: 复杂过滤 "高于全级平均分的人",Excel 高级筛选的条件区域设置如下...: - 这次需要在条件值中使用函数公式 - =K2>AVERAGE(K:K) ,你可以想象成,Excel 会遍历每行,遍历时,会把函数公式中的 K2 ,用当前行的值替换 pandas 实现思路是一样的..."总分高于所在班级平均分的学校",Excel 高级筛选的条件区域设置如下: - 此时不能简单使用 AVERAGE ,这是因为我们需要根据 班级 获得该班级的平均分,这次使用 AVERAGEIF(B:B

    45220

    懂Excel也能轻松入门Python数据分析包pandas(二):高级筛选(下)

    系列文章: -懂Excel也能轻松入门Python数据分析包pandas(二):高级筛选(上) 前言 经常听别人说 Python 在数据领域有多厉害,结果学了很长时间,连数据处理都麻烦得要死。...后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器—— pandas 。 紧接着上一篇的高级筛选,不过上一篇的例子太简单了,这次来点难度。...数据 继续沿用上一篇的数据: - 某学校的一份考试成绩表(8科成绩) 加载数据 pandas 需要加载 Excel 数据,如下: 复杂过滤 "高于全级平均分的人",Excel 高级筛选的条件区域设置如下...: - 这次需要在条件值中使用函数公式 - =K2>AVERAGE(K:K) ,你可以想象成,Excel 会遍历每行,遍历时,会把函数公式中的 K2 ,用当前行的值替换 pandas 实现思路是一样的..."总分高于所在班级平均分的学校",Excel 高级筛选的条件区域设置如下: - 此时不能简单使用 AVERAGE ,这是因为我们需要根据 班级 获得该班级的平均分,这次使用 AVERAGEIF(B:B

    50410

    懂Excel也能轻松入门Python数据分析包pandas(二):高级筛选(上)

    上一篇文章从 Excel 筛选为核心,介绍 pandas 中的实现,但是,Excel 中还有一个高级筛选的功能,普通的筛选与其对比,就只能算是"低级筛选"功能了。...数据 本文示例数据如下: - 某学校的一份考试成绩表(8科成绩) - 人名已做脱敏处理 加载数据 pandas 需要加载 Excel 数据,非常容易,如下: - 大部分参数上一篇文章已经有说明..."姓名是 A1 的记录",Excel 高级筛选操作步骤如下: - 功能区 "数据" 页,在"筛选大图标" 右下有一个 "高级" ,点击出来高级筛选功能窗口 - 主要看上图2的红框,选择我们的数据源区域...pandas 中没有啥高级筛选的说法,因为他的筛选本来就很灵活,看看 pandas 的实现: - 简单易懂,都是之前文章介绍过的,这里不多说 特定值过滤 "4、5或7班的记录",Excel 高级筛选的条件区域设置如下...- 第二句即查询,通俗易懂 "语文高于90,或者,数学高于或等于100",Excel 高级筛选的条件区域设置如下: pandas 实现如下: - query 中的查询字符串可以使用 python

    1.2K20

    懂Excel也能轻松入门Python数据分析包pandas(二):高级筛选(上)

    上一篇文章从 Excel 筛选为核心,介绍 pandas 中的实现,但是,Excel 中还有一个高级筛选的功能,普通的筛选与其对比,就只能算是"低级筛选"功能了。...数据 本文示例数据如下: - 某学校的一份考试成绩表(8科成绩) - 人名已做脱敏处理 加载数据 pandas 需要加载 Excel 数据,非常容易,如下: - 大部分参数上一篇文章已经有说明..."姓名是 A1 的记录",Excel 高级筛选操作步骤如下: - 功能区 "数据" 页,在"筛选大图标" 右下有一个 "高级" ,点击出来高级筛选功能窗口 - 主要看上图2的红框,选择我们的数据源区域...pandas 中没有啥高级筛选的说法,因为他的筛选本来就很灵活,看看 pandas 的实现: - 简单易懂,都是之前文章介绍过的,这里不多说 特定值过滤 "4、5或7班的记录",Excel 高级筛选的条件区域设置如下...- 第二句即查询,通俗易懂 "语文高于90,或者,数学高于或等于100",Excel 高级筛选的条件区域设置如下: pandas 实现如下: - query 中的查询字符串可以使用 python

    1.6K10

    20 个短小精悍的 pandas 骚操作!

    而Excel就不一样了,ExcelWriter是pandas的一个类,可以使dataframe数据框直接输出到excel文件,并可以指定sheets名称。...比如,我们在做数据清洗的时候,往往代码会很乱,有去重、去异常值、编码转换等等。如果使用pipe,将是这样子的。...boston.describe().T.head(10) 8. pandas styler pandas也可以像excel一样,设置表格的可视化条件格式,而且只需要一行代码即可(可能需要一丢丢的前端...详细的可以参考我之前写的骚操作系列:一行 pandas 代码搞定 Excel “条件格式”! 9. Pandas options pandas里提供了很多宏设置选项,被分为下面5大类。...diamonds.nlargest(5, "price") 15. idmax、idxmin 我们用列轴使用max或min时,pandas 会返回最大/最小的值。

    1.1K30

    20 个短小精悍的 pandas 骚操作

    而Excel就不一样了,ExcelWriter是pandas的一个类,可以使dataframe数据框直接输出到excel文件,并可以指定sheets名称。...比如,我们在做数据清洗的时候,往往代码会很乱,有去重、去异常值、编码转换等等。如果使用pipe,将是这样子的。...boston.describe().T.head(10) 8. pandas styler pandas也可以像excel一样,设置表格的可视化条件格式,而且只需要一行代码即可(可能需要一丢丢的前端HTML...详细的可以参考我之前写的骚操作系列:一行 pandas 代码搞定 Excel “条件格式”! 9. Pandas options pandas里提供了很多宏设置选项,被分为下面5大类。...diamonds.nlargest(5, "price") 15. idmax、idxmin 我们用列轴使用max或min时,pandas 会返回最大/最小的值。

    1.2K20

    Pandas数据应用:库存管理

    二、常见问题(一)数据读取与存储数据来源多样在库存管理中,数据可能来自不同的渠道,如Excel表格、CSV文件、数据库等。对于初学者来说,可能会遇到不知道如何选择合适的数据读取方式的问题。...对于Excel文件,使用pandas.read_excel()函数;对于CSV文件,使用pandas.read_csv()函数。...例如:import pandas as pd# 读取Excel文件df = pd.read_excel('inventory.xlsx')# 读取CSV文件df = pd.read_csv('inventory.csv...这会影响后续的数据分析和处理。可以使用pd.to_datetime()函数转换日期格式,pd.to_numeric()函数转换数值格式。...在库存管理中的应用非常广泛,从数据读取到数据清洗,再到数据查询与筛选等各个环节都发挥着重要作用。

    12410

    Pandas实现分列功能(Pandas读书笔记1)

    方法二、Excel达人! Excel强如我的!肯定不会手动筛选然后粘贴了!VBA一串代码搞定! 还是直接用强大如我的阿凯的Excel插件解决问题吧! ?...代表文本没有转义字符,第一段输入的是打开文件的路径及文件名,encoding后面接的参数是代表使用什么编码gb18030比gb2312更为强大!...save变量,中括号内是判断条件,df.loc[]代表将符合筛选条件的筛选出来 save.to_csv('D:/拆分后数据/'+ str(township) + '.csv',index=False...,sep=',') #存储至新的文件夹,并且按照筛选条件命名文件 知道有的朋友看到这些代码很头疼!...本期只是解释小编为什么分享pandas,代码只是顺便分享的! 后续我们从pandas最基础的知识开始分享! 如果你有用Excel处理大数据的需求,学习pandas准没有错!

    3.6K40

    盘点一个使用Python实现Excel中找出第一个及最后一个不为零的数,它们各自在第几列

    数据截图如下所示: 二、实现过程 这里【小小明】大佬给了一个方法,使用Pandas实现,如下所示: # code by:小小明大佬 import pandas as pd df = pd.read_excel...row.index[-1] result.append([code, s_num, s_i, e_num, e_i]) result = pd.DataFrame(result, columns=["产品编码...这里再补充下,df.itertuples()生成一个namedtuples类型数据,name默认名为Pandas,可以在参数中指定。...与df.iterrows()相比,df.itertuples()运行速度会更快一些,推荐在数据量庞大的情况下优先使用。...这篇文章主要盘点了一个Python实现Excel中筛选数据的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。

    40220

    文件读取功能(Pandas读书笔记7)

    一天一更有点受不了了~~~~ pandas主要有DataFrame和Series两种数据类型。 DataFrame类似于一张Excel表,Series类似于Excel中的某一列。...最初笔者想要学习和分享Pandas主要是为了解决Excel无法解决的海量数据处理问题,所以我接下来分享的重点就是如何使用Pandas解决Excel那些常见的操作!...本来想从数据的筛选排序分享起,但是考虑大家如果没有东西练手会很难受,所以我先从如何通过Pandas读写文件分享起!...原谅我无法给你们一个文件进行测试,这个难题需要在工作中遇到再解决,但是其实刚刚的代码我已经给你们提供了一种解决方案~ errors='ignore' 但是实际工作中会出现部分行由于存储问题或者编码问题导致无法正常读取...那我们用之前的代码读取会怎样呢? ? ? 我们发现数据混杂在了一起,那如何将他们按照竖线分好列呢?增加一个参数即可! ?

    3.9K50

    手把手教你使用Pandas从Excel文件中提取满足条件的数据并生成新的文件(附源码)

    方法一:分别取日期与小时,按照日期和小时删除重复项 import pandas as pd excel_filename = '数据.xlsx' df = pd.read_excel(excel_filename...excel文件 df.to_excel('数据筛选结果2.xlsx') 方法二:把日期中的分秒替换为0 import pandas as pd excel_filename = '数据.xlsx'...文件 df.to_excel('数据筛选结果2.xlsx') 方法三:对日期时间按照小时进行分辨 import pandas as pd excel_filename = '数据.xlsx' df...excel文件 df.to_excel('数据筛选结果2.xlsx') 方法五:对日期时间进行重新格式,并按照新的日期时间删除 import pandas as pd excel_filename...= '数据.xlsx' df = pd.read_excel(excel_filename) # 方法五:对日期时间进行重新格式,并按照新的日期时间删除重复项(会引入新列) df['new'] = df

    3.7K50

    手把手教你利用Python轻松拆分Excel为多个CSV文件

    一、前言 在日常生活或者工作中的时候,我们偶尔会遇到这样一种让人头大的情况——当单个Excel文件较大或需要根据某一列的内容需要拆分为多个CSV文件时,用Excel的筛选功能去慢慢筛选虽然可行,但是来回反复倒腾工作量就比较大了...三、项目准备 软件:PyCharm 需要的库:tkinter, pandas,xlrd 四、项目分析 1)如何选择目标文件? 利用tkinter库中的filedialog,进行要处理的目标文件选择。...2)如何读取Excel文件? 利用xlrd库进行Excel读取,获取要处理的目标Sheet。 3)如何筛选列内容? 利用pandas库进行列内容的筛选处理,得到拆分后的数据。 4)如何保存文件?...五、项目实现 1、第一步导入需要的库 from tkinter import filedialog import pandas as pd import xlrd 2、第二步选择目标文件 path =.../excel_CSV/auto_ok/32_'+c+'.CSV', encoding='gbk',index=None) # 筛选后的内容保存为CSV 六、效果展示 1、处理前Excel数据

    1.3K10

    手把手教你利用Python轻松拆分Excel为多个CSV文件

    一、前言 在日常生活或者工作中的时候,我们偶尔会遇到这样一种让人头大的情况——当单个Excel文件较大或需要根据某一列的内容需要拆分为多个CSV文件时,用Excel的筛选功能去慢慢筛选虽然可行,但是来回反复倒腾工作量就比较大了...三、项目准备 软件:PyCharm 需要的库:tkinter, pandas,xlrd 四、项目分析 1)如何选择目标文件? 利用tkinter库中的filedialog,进行要处理的目标文件选择。...2)如何读取Excel文件? 利用xlrd库进行Excel读取,获取要处理的目标Sheet。 3)如何筛选列内容? 利用pandas库进行列内容的筛选处理,得到拆分后的数据。 4)如何保存文件?...五、项目实现 1、第一步导入需要的库 from tkinter import filedialogimport pandas as pdimport xlrd 2、第二步选择目标文件 path =.../excel_CSV/auto_ok/32_'+c+'.CSV', encoding='gbk',index=None) # 筛选后的内容保存为CSV 六、效果展示 1、处理前Excel数据:

    1.1K30
    领券