首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >对比Excel,更强大的Python pandas筛选(续)

对比Excel,更强大的Python pandas筛选(续)

作者头像
fanjy
发布2022-04-14 09:03:44
发布2022-04-14 09:03:44
1.1K00
举报
文章被收录于专栏:完美Excel完美Excel
运行总次数:0

标签:Python与Excel,pandas

接着《对比Excel,更强大的Python pandas筛选》,我们继续讲解pandas数据框架中的高级筛选,涉及到OR、AND、NOT逻辑。

准备用于演示的数据框架

本文继续使用世界500强公司数据集。首先,我们激活pandas并从百度百科加载数据。下面附上了数据表的屏幕截图,以便于参考。

代码语言:javascript
代码运行次数:0
运行
复制
import pandas as pd
df = pd.read_html('https://baike.baidu.com/item/%E4%B8%96%E7%95%8C500%E5%BC%BA/640042?fr=aladdin')[1]

图1

条件组合

当需要满足其中一个条件时,使用OR逻辑。例如,要获得所有中国和德国的世界500强公司,意味着我们希望总部所在国家要么是中国,要么是德国。注意:

  • 在这种情况下,常规or逻辑运算符不起作用,我们必须使用位逻辑运算符“|”,意味着“或“。
  • 每个条件都需要用一对括号括起来。
代码语言:javascript
代码运行次数:0
运行
复制
df_1 = df.loc[(df['总部所在国家'] == '中国') | (df['总部所在国家'] == '德国')]

图2

在上面的代码中,我们在.loc[]中有两个布尔索引。下面是一个简化的Excel示例,演示|运算符的含义。

图3

交集

当需要满足两个(或更多)条件时,使用AND逻辑。例如,我们可以了解有多少中国500强公司的利润大于500亿美元。

代码语言:javascript
代码运行次数:0
运行
复制
df_2 = df.loc[(df['总部所在国家'] == '中国') &(df['利润(百万美元)'] > 5000)]

图4

同样,我们需要使用按位AND运算符“&”,并用一对括号将条件括起来。下面的Excel示例显示了&的含义。

图5

相反

要选择相反面,我们需要使用NOT逻辑运算符。按位NOT是“~”。下面是一个Excel示例。

图6

要选择不在美国的所有公司,可以使用下面的代码:

代码语言:javascript
代码运行次数:0
运行
复制
df_3 = df.loc[~(df['总部所在国家'] == '美国')]

或者:

代码语言:javascript
代码运行次数:0
运行
复制
df_3 = df.loc[df['总部所在国家'] != '美国']

图7

注:本文学习整理自pythoninoffice.com。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-04-13,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 完美Excel 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档