系列文章:
前言
经常听别人说 Python 在数据领域有多厉害,结果学了很长时间,连数据处理都麻烦得要死。后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器—— pandas 。
紧接着上一篇的高级筛选,不过上一篇的例子太简单了,这次来点难度。
数据
继续沿用上一篇的数据:
加载数据
pandas 需要加载 Excel 数据,如下:
复杂过滤
"高于全级平均分的人",Excel 高级筛选的条件区域设置如下:
pandas 实现思路是一样的,如下:
上面的需求还是有点简单,再加点料。
"总分高于所在班级平均分的学校",Excel 高级筛选的条件区域设置如下:
pandas 实现则显得麻烦点。如下:
为难 Excel 的任务
有些任务用 Excel 自带功能则非常繁琐,比如:
"全级中,8科成绩都超出全级平均分的学生"
这任务如果用 Excel 实现,必须逐一对每个科目进行求平均,直接看看 pandas 的实现:
看看调用结果:
这时候,如果需要看 "8科成绩都超出该班级的平均分的学生",则非常简单了:
是不是 so easy?!
来看看有哪些学生需要留堂见家长。
"8科成绩都低于班内平均水平的学生",仍然很简单: