首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >懂Excel也能轻松入门Python数据分析包pandas(二):高级筛选(下)

懂Excel也能轻松入门Python数据分析包pandas(二):高级筛选(下)

作者头像
咋咋
发布于 2021-09-01 07:19:15
发布于 2021-09-01 07:19:15
4770
举报
文章被收录于专栏:数据大宇宙数据大宇宙

系列文章:

前言

经常听别人说 Python 在数据领域有多厉害,结果学了很长时间,连数据处理都麻烦得要死。后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器—— pandas 。

紧接着上一篇的高级筛选,不过上一篇的例子太简单了,这次来点难度。

数据

继续沿用上一篇的数据:

  • - 某学校的一份考试成绩表(8科成绩)

加载数据

pandas 需要加载 Excel 数据,如下:

复杂过滤

"高于全级平均分的人",Excel 高级筛选的条件区域设置如下:

  • - 这次需要在条件值中使用函数公式
  • - =K2>AVERAGE(K:K) ,你可以想象成,Excel 会遍历每行,遍历时,会把函数公式中的 K2 ,用当前行的值替换

pandas 实现思路是一样的,如下:

上面的需求还是有点简单,再加点料。

"总分高于所在班级平均分的学校",Excel 高级筛选的条件区域设置如下:

  • - 此时不能简单使用 AVERAGE ,这是因为我们需要根据 班级 获得该班级的平均分,这次使用 AVERAGEIF(B:B,B2,K:K)

pandas 实现则显得麻烦点。如下:

  • - .groupby('班级') ,按班级分组
  • - .apply ,对每组查询总分超出平均分的记录。这里的 query 字符串与上一例子是一样的

为难 Excel 的任务

有些任务用 Excel 自带功能则非常繁琐,比如:

"全级中,8科成绩都超出全级平均分的学生"

这任务如果用 Excel 实现,必须逐一对每个科目进行求平均,直接看看 pandas 的实现:

  • - 定义一个方法,这有利于重用逻辑
  • - 前2句,先求出每科平均分
  • - 然后求出每位学生高于平均分的科目数量 count
  • - 最后简单判断一下,即可得到结果

看看调用结果:

这时候,如果需要看 "8科成绩都超出该班级的平均分的学生",则非常简单了:

  • - 这些都是班内的"三好学生"

是不是 so easy?!

来看看有哪些学生需要留堂见家长。

"8科成绩都低于班内平均水平的学生",仍然很简单:

  • - 仅仅添加一个参数 sjs=0 ,即可得到结果
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-08-01,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据大宇宙 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
懂Excel也能轻松入门Python数据分析包pandas(二):高级筛选(上)
经常听别人说 Python 在数据领域有多厉害,结果学了很长时间,连数据处理都麻烦得要死。后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器—— pandas 。
Excel催化剂
2021/08/20
1.7K0
懂Excel也能轻松入门Python数据分析包pandas(二):高级筛选(上)
懂Excel轻松入门Python数据分析包pandas(二十二):排名
> 经常听别人说 Python 在数据领域有多厉害,结果学了很长时间,连数据处理都麻烦得要死。后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器—— pandas
Excel催化剂
2021/08/19
5250
懂Excel轻松入门Python数据分析包pandas(二十二):排名
懂Excel轻松入门Python数据分析包pandas(二十五):循环序列分组
> 经常听别人说 Python 在数据领域有多厉害,结果学了很长时间,连数据处理都麻烦得要死。后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器—— pandas
Excel催化剂
2021/08/19
1K0
懂Excel轻松入门Python数据分析包pandas(二十五):循环序列分组
懂Excel轻松入门Python数据分析包pandas(二十五):循环序列分组
> 经常听别人说 Python 在数据领域有多厉害,结果学了很长时间,连数据处理都麻烦得要死。后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器—— pandas
咋咋
2021/09/01
8010
懂Excel轻松入门Python数据分析包pandas(二十五):循环序列分组
懂Excel轻松入门Python数据分析包pandas(十九):文本条件统计
> 经常听别人说 Python 在数据领域有多厉害,结果学了很长时间,连数据处理都麻烦得要死。后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器—— pandas
咋咋
2021/09/01
1.3K0
懂Excel轻松入门Python数据分析包pandas(十九):文本条件统计
懂Excel轻松入门Python数据分析包pandas(十九):文本条件统计
> 经常听别人说 Python 在数据领域有多厉害,结果学了很长时间,连数据处理都麻烦得要死。后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器—— pandas
Excel催化剂
2021/08/19
1.5K0
懂Excel轻松入门Python数据分析包pandas(十九):文本条件统计
懂Excel就能轻松入门Python数据分析包pandas(五):重复值处理
> 经常听别人说 Python 在数据领域有多厉害,结果学了很长时间,连数据处理都麻烦得要死。后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器—— pandas
Excel催化剂
2021/08/20
1.5K0
懂Excel就能轻松入门Python数据分析包pandas(五):重复值处理
零基础5天入门Python数据分析:第五课
在第一第二课已经讲了notebook的基础使用,python的基础语法及常用的数据结构及其运算,包括:
明月AI
2021/10/28
1.7K0
零基础5天入门Python数据分析:第五课
懂Excel就能轻松入门Python数据分析包pandas(七):分列
> 经常听别人说 Python 在数据领域有多厉害,结果学了很长时间,连数据处理都麻烦得要死。后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器—— pandas
Excel催化剂
2021/08/20
2.9K0
懂Excel就能轻松入门Python数据分析包pandas(七):分列
懂Excel就能轻松入门Python数据分析包pandas(三):制作成绩条
很多从未接触 pandas 的小伙伴看到相关资料后,会觉得这玩意无法处理像 Excel 那样格式复杂多变的数据。其实 pandas 比起手动操作、透视表操作甚至 Vba 操作,他可以更灵活快速处理复杂形状的数据。
Excel催化剂
2021/08/20
7570
懂Excel就能轻松入门Python数据分析包pandas(三):制作成绩条
懂Excel就能轻松入门Python数据分析包pandas(六):排序
> 经常听别人说 Python 在数据领域有多厉害,结果学了很长时间,连数据处理都麻烦得要死。后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器—— pandas
Excel催化剂
2021/08/20
8360
懂Excel就能轻松入门Python数据分析包pandas(六):排序
数据分析面试必考—SQL快速入门宝典
SQL全称Structured Query Language,说人话就是结构化查询语言。毫不夸张地说,它是数据分析必会技能Top1,因为没有哪个初级数据分析师的面试能跨过SQL技能考核这一项的。
用户8612862
2021/05/13
4.7K0
数据分析面试必考—SQL快速入门宝典
懂Excel轻松入门Python数据分析包pandas(二十三):环比
> 经常听别人说 Python 在数据领域有多厉害,结果学了很长时间,连数据处理都麻烦得要死。后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器—— pandas
Excel催化剂
2021/08/19
1K0
懂Excel轻松入门Python数据分析包pandas(二十三):环比
懂Excel轻松入门Python数据分析包pandas(二十):数值条件统计
> 经常听别人说 Python 在数据领域有多厉害,结果学了很长时间,连数据处理都麻烦得要死。后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器—— pandas
Excel催化剂
2021/08/19
8420
懂Excel轻松入门Python数据分析包pandas(二十):数值条件统计
"Python替代Excel Vba"系列(二):pandas分组统计与操作Excel
在本系列的上一节已经介绍了如何读写 excel 数据,并快速进行汇总处理。但有些小伙伴看完之后有些疑惑:
咋咋
2021/09/01
1.9K0
"Python替代Excel Vba"系列(二):pandas分组统计与操作Excel
懂Excel轻松入门Python数据分析包pandas(二十三):环比
> 经常听别人说 Python 在数据领域有多厉害,结果学了很长时间,连数据处理都麻烦得要死。后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器—— pandas
咋咋
2021/09/01
9060
懂Excel轻松入门Python数据分析包pandas(二十三):环比
懂Excel轻松入门Python数据分析包pandas(二十七):按条件选择,就是这么简单
Excel 函数中有一个初学者都能马上学会的函数——IF 函数,而在 pandas 中却没有对应效果的方法,这是因为 numpy 已经有了对应的实现—— where。
咋咋
2021/09/01
8850
懂Excel轻松入门Python数据分析包pandas(二十七):按条件选择,就是这么简单
智能分析:ChatGPT+Excel+Python超强组合玩转数据分析
首先是顶流Python高举卷王之王的大旗向传统王者VBA抢班夺权,pandas, xlwings、OpenPyXL和Matplotlib等第三方包已经具备VBA和Power Query的几乎所有功能。
博文视点Broadview
2023/12/21
1.3K0
智能分析:ChatGPT+Excel+Python超强组合玩转数据分析
懂Excel就能轻松入门Python数据分析包pandas(十二):多列堆叠
> 经常听别人说 Python 在数据领域有多厉害,结果学了很长时间,连数据处理都麻烦得要死。后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器—— pandas
Excel催化剂
2021/08/19
9660
懂Excel就能轻松入门Python数据分析包pandas(十二):多列堆叠
懂Excel就能轻松入门Python数据分析包pandas(十五):拆分数据
> 经常听别人说 Python 在数据领域有多厉害,结果学了很长时间,连数据处理都麻烦得要死。后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器—— pandas
咋咋
2021/09/01
7920
懂Excel就能轻松入门Python数据分析包pandas(十五):拆分数据
推荐阅读
懂Excel也能轻松入门Python数据分析包pandas(二):高级筛选(上)
1.7K0
懂Excel轻松入门Python数据分析包pandas(二十二):排名
5250
懂Excel轻松入门Python数据分析包pandas(二十五):循环序列分组
1K0
懂Excel轻松入门Python数据分析包pandas(二十五):循环序列分组
8010
懂Excel轻松入门Python数据分析包pandas(十九):文本条件统计
1.3K0
懂Excel轻松入门Python数据分析包pandas(十九):文本条件统计
1.5K0
懂Excel就能轻松入门Python数据分析包pandas(五):重复值处理
1.5K0
零基础5天入门Python数据分析:第五课
1.7K0
懂Excel就能轻松入门Python数据分析包pandas(七):分列
2.9K0
懂Excel就能轻松入门Python数据分析包pandas(三):制作成绩条
7570
懂Excel就能轻松入门Python数据分析包pandas(六):排序
8360
数据分析面试必考—SQL快速入门宝典
4.7K0
懂Excel轻松入门Python数据分析包pandas(二十三):环比
1K0
懂Excel轻松入门Python数据分析包pandas(二十):数值条件统计
8420
"Python替代Excel Vba"系列(二):pandas分组统计与操作Excel
1.9K0
懂Excel轻松入门Python数据分析包pandas(二十三):环比
9060
懂Excel轻松入门Python数据分析包pandas(二十七):按条件选择,就是这么简单
8850
智能分析:ChatGPT+Excel+Python超强组合玩转数据分析
1.3K0
懂Excel就能轻松入门Python数据分析包pandas(十二):多列堆叠
9660
懂Excel就能轻松入门Python数据分析包pandas(十五):拆分数据
7920
相关推荐
懂Excel也能轻松入门Python数据分析包pandas(二):高级筛选(上)
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档