首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Pandas -如何在一列中查找一组值,如果存在,则在另一列中返回值

Pandas是一个基于Python的数据分析库,提供了丰富的数据结构和数据分析工具。在Pandas中,可以使用多种方法来在一列中查找一组值,并在另一列中返回相应的值。

一种常用的方法是使用isin()函数。该函数可以判断一列中的每个元素是否在给定的一组值中,并返回一个布尔值的Series,表示是否存在。

下面是一个示例代码,演示了如何使用isin()函数来实现上述功能:

代码语言:python
代码运行次数:0
复制
import pandas as pd

# 创建一个示例DataFrame
data = {'A': [1, 2, 3, 4, 5],
        'B': ['apple', 'banana', 'orange', 'apple', 'grape']}
df = pd.DataFrame(data)

# 定义要查找的一组值
values_to_find = ['apple', 'banana']

# 使用isin()函数查找一组值,并在另一列中返回相应的值
df['C'] = df['B'].isin(values_to_find)

# 打印结果
print(df)

运行以上代码,将会输出以下结果:

代码语言:txt
复制
   A       B      C
0  1   apple   True
1  2  banana   True
2  3  orange  False
3  4   apple   True
4  5   grape  False

在上述示例中,我们首先创建了一个示例的DataFrame,其中包含两列数据'A'和'B'。然后,我们定义了要查找的一组值values_to_find,即'apple'和'banana'。接下来,我们使用isin()函数将DataFrame的列'B'与values_to_find进行比较,得到一个布尔值的Series。最后,我们将这个Series赋值给新的列'C',以表示是否存在。

需要注意的是,以上示例中并未提及腾讯云相关产品和产品介绍链接地址,因为腾讯云并没有与Pandas直接相关的产品或服务。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

Excel公式技巧71:查找一列中有多少个值出现在另一列中

学习Excel技术,关注微信公众号: excelperfect 有时候,我们想要知道某列中有多少个值同时又出现在另一列中,例如下图1所示,列B中有一系列值,列D中有一系列值,哪些值既出现有列B中又出现在列...因为数据较少,不难看出,在列B中仅有2个值出现在列D中,即“完美Excel”和“Office”。 ?...MATCH(B3:B13,B3:B13,0) 查找单元格区域B3:B13中每个单元格的值在该区域首次出现的位置,得到数组: {1;2;3;1;5;6;2;3;5;1;2} 公式中: ROW(B3:B13...D3:D16,0) 转换为: MATCH({"完美Excel";"Office";"Excel";"";"excelperfect";"Word";"";"";"";"";""},D3:D16,0) 查找上述不重复值组成的数组在单元格区域...传递给COUNT函数统计数组中数字的个数: COUNT({1;5;#N/A;#N/A;#N/A;#N/A;#N/A;#N/A;#N/A;#N/A;#N/A}) 得到结果: 2 即列B中有两个值在列D中出现

3.3K20

Pandas全景透视:解锁数据科学的黄金钥匙

DataFrame的一列就是Series,Series可以转化为DataFrame,调用方法函数to_frame()即可 Series 是 pandas 中的一种数据结构,可以看作是带有标签的一维数组。...索引提供了对 Series 中数据的标签化访问方式。值(Values): 值是 Series 中存储的实际数据,可以是任何数据类型,如整数、浮点数、字符串等。...0或’index’,表示按行删除;1或’columns’,表示按列删除。inplace:是否原地替换。布尔值,默认为False。如果为True,则在原DataFrame上进行操作,返回值为None。...如果method被指定,对于连续的空值,这段连续区域,最多填充前 limit 个空值(如果存在多段连续区域,每段最多填充前 limit 个空值)。...n,则表示将x中的数值分成等宽的n份(即每一组内的最大值与最小值之差约相等);如果是标量序列,序列中的数值表示用来分档的分界值如果是间隔索引,“ bins”的间隔索引必须不重叠举个例子import pandas

11710
  • 最全面的Pandas的教程!没有之一!

    因为我们只获取一列,所以返回的就是一个 Series。可以用 type() 函数确认返回值的类型: ? 如果获取多个列,那返回的就是一个 DataFrame 类型: ?...清洗数据 删除或填充空值 在许多情况下,如果你用 Pandas 来读取大量数据,往往会发现原始数据中会存在不完整的地方。...在 Pandas 里,主要用到 3 种方法: 首先是 .unique() 方法。比如在下面这个 DataFrame 里,查找 col2 列中所有不重复的值: ?...排序 如果想要将整个表按某一列的值进行排序,可以用 .sort_values() : ? 如上所示,表格变成按 col2 列的值从小到大排序。...查找空值 假如你有一个很大的数据集,你可以用 Pandas 的 .isnull() 方法,方便快捷地发现表中的空值: ?

    26K64

    删除重复值,不只Excel,Python pandas更行

    此方法包含以下参数: subset:引用列标题,如果只考虑特定列以查找重复值,则使用此方法,默认为所有列。 keep:保留哪些重复值。’...图3 在上面的代码中,我们选择不传递任何参数,这意味着我们检查所有列是否存在重复项。唯一完全重复的记录是记录#5,它被丢弃了。因此,保留了第一个重复的值。...如果我们指定inplace=True,那么原始的df将替换为新的数据框架,并删除重复项。 图5 在列表或数据表列中查找唯一值 有时,我们希望在数据框架列的列表中查找唯一值。...数据框架是一个表或工作表,而pandas Series是该表/表中的一列。换句话说,数据框架由各种系列组成。...图7 Python集 获取唯一值的另一种方法是使用Python中的数据结构set,集(set)基本上是一组唯一项的集合。由于集只包含唯一项,如果我们将重复项传递到集中,这些重复项将自动删除。

    6.1K30

    从pandas中的这几个函数,我看懂了道家“一生二、二生三、三生万物”

    本文主要讲解pandas中的7个聚合统计相关函数,所用数据创建如下: ?...正因为各列的返回值是一个ndarray,而对于一个dataframe对象各列的唯一值ndarray长度可能不一致,此时无法重组成一个二维ndarray,从这个角度可以理解unique不适用于dataframe...03 value_counts 如果说unique可以返回唯一值结果的话,那么value_counts则在其基础上进一步统计各唯一值出现的个数;类似的,unique返回一个无标签的一维ndarray作为结果...如果说前面的三个函数主要适用于pandas中的一维数据结构series的话(nunique也可用于dataframe),那么接下来的这两个函数则是应用于二维dataframe。...数据透视表本质上仍然数据分组聚合的一种,只不过是以其中一列的唯一值结果作为行、另一列的唯一值结果作为列,然后对其中任意(行,列)取值坐标下的所有数值进行聚合统计,就好似完成了数据透视一般。

    2.5K10

    如何用Python将时间序列转换为监督学习问题

    t 0 0 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 通过在观测值的列数据中插入新的一列,我们可以将上面展示的观测值位置下移一格,由于新加的一行并没有数据...忽略行标签,第一列的数据由于存在NaN值应当被丢弃。从第二行来看,输入数据0.0位于第二列(X),输出数据1位于第一列(y)。...在这种问题中,我们在一个时间序列中不是仅有一组观测值而是有多组观测值(如温度和大气压)。此时时间序列中的变量需要整体前移或者后移来创建多元的输入序列和输出序列。我们稍后将讨论这个问题。...单步单变量预测 在时间序列预测中的标准做法是使用滞后的观测值(如t-1)作为输入变量来预测当前的时间的观测值(t)。 这被称为单步预测。...除此之外,具有NaN值的行已经从DataFrame中自动删除。 我们可以指定任意长度的输入序列(如3)来重复这个例子。

    24.9K2110

    在Python中实现Excel的VLOOKUP、HLOOKUP、XLOOKUP函数功能

    标签:Python与Excel,pandas Excel的LOOKUP公式可能是最常用的公式之一,因此这里将在Python中实现Excel中查找系列公式的功能。...VLOOKUP可能是最常用的,但它受表格格式的限制,查找项必须位于我们正在执行查找的数据表最左边的列。换句话说,如果我们试图带入的值位于查找项的左侧,那么VLOOKUP函数将不起作用。...在第一行中,我们用一些参数定义了一个名为xlookup的函数: lookup_value:我们感兴趣的值,这将是一个字符串值 lookup_array:这是源数据框架中的一列,我们正在查找此数组/列中的...“lookup_value” return_array:这是源数据框架中的一列,我们希望从该列返回值 if_not_found:如果未找到”lookup_value”,将返回的值 在随后的行中: lookup_array...pandas系列的一个优点是它的.empty属性,告诉我们该系列是否包含值或空,如果match_value为空,那么我们知道找不到匹配项,然后我们可以通知用户在数据中找不到查找值。

    7.4K11

    Python数据分析笔记——Numpy、Pandas库

    (3)获取Series中的值 通过索引的方式选取Series中的单个或一组值。...(3)获取DataFrame的值(行或列) 通过查找columns值获取对应的列。(下面两种方法) 通过索引字段ix查找相应的行。 (4)对列进行赋值处理。 对某一列可以赋一个标量值也可以是一组值。...也可以给某一列赋值一个列表或数组,其长度必须跟DataFrame长度相匹配。如果赋值的是一个Series,则对应的索引位置将被赋值,其他位置的值被赋予空值。...Pandas基本功能 1、重新索引 Pandas对象的一个方法就是重新索引(reindex),其作用是创建一个新的索引,pandas对象将按这个新索引进行排序。对于不存在的索引值,引入缺失值。...obj.rank() (2)DataFrame数据结构的排序和排名 按索引值进行排列,一列或多列中的值进行排序,通过by将列名传递给sort_index. 5、缺失数据处理 (1)滤出缺失数据 使用data.dropna

    6.4K80

    筛选功能(Pandas读书笔记9)

    今天和大家分享如果使用Pandas实现单、多条件筛选、模糊筛选。 还是老套路,我们需要先读取一组数据作为测试文件。...分享筛选功能之前,我们先分享如何提取某一列,某一行 一、提取DataFrame数据的某一行 1、显示前N行 使用head函数 ? 2、显示后N行 ? 3、显示任意某一行 ?...这里两个数字都是闭合的,案例中[7:11]则选取的是第8行至第12行(pandas从0开始编号) 二、提取任意列 1、按照列名提取单列 ? 2、按照列名提取多列 ?...七、模糊筛选 模糊筛选想当年也浪费了我不少时间,我以为pandas会自带一个函数来的,结果是使用字符串的形式来实现的~ 提问:我们将名称那一列含有“金”字的行提取出来~ Excel实现这个功能很简单...find函数,如果find的返回值大于0,证明就是含有金字的,如果没有金字,返回值是-1,所以通过该方法可以判断哪行数据含有金字。

    5.9K61

    干货!直观地解释和可视化每个复杂的DataFrame操作

    Pivot 透视表将创建一个新的“透视表”,该透视表将数据中的现有列投影为新表的元素,包括索引,列和值。初始DataFrame中将成为索引的列,并且这些列显示为唯一值,而这两列的组合将显示为值。...包含值的列将转换为两列:一列用于变量(值列的名称),另一列用于值(变量中包含的数字)。 ? 结果是ID列的值(a,b,c)和值列(B,C)及其对应值的每种组合,以列表格式组织。...默认情况下,合并功能执行内部联接:如果每个DataFrame的键名均未列在另一个键中,则该键不包含在合并的DataFrame中。...另一方面,如果一个键在同一DataFrame中列出两次,则在合并表中将列出同一键的每个值组合。...请注意,concat是pandas函数,而不是DataFrame之一。因此,它接受要连接的DataFrame列表。 如果一个DataFrame的另一列未包含,默认情况下将包含该列,缺失值列为NaN。

    13.3K20

    python数据科学系列:pandas入门详细教程

    这里提到了index和columns分别代表行标签和列标签,就不得不提到pandas中的另一个数据结构:Index,例如series中标签列、dataframe中行标签和列标签均属于这种数据结构。...自然毫无悬念 dataframe:无法访问单个元素,只能返回一列、多列或多行:单值或多值(多个列名组成的列表)访问时按列进行查询,单值访问不存在列名歧义时还可直接用属性符号" ....时间类型向量化操作,如字符串一样,在pandas中另一个得到"优待"的数据类型是时间类型,正如字符串列可用str属性调用字符串接口一样,时间类型列可用dt属性调用相应接口,这在处理时间类型时会十分有效。...pandas中的另一大类功能是数据分析,通过丰富的接口,可实现大量的统计需求,包括Excel和SQL中的大部分分析过程,在pandas中均可以实现。...例如,以某列取值为重整后行标签,以另一列取值作为重整后的列标签,以其他列取值作为填充value,即实现了数据表的行列重整。

    15K20

    Pandas速查卡-Python数据科学

    如果你对pandas的学习很感兴趣,你可以参考我们的pandas教程指导博客(http://www.dataquest.io/blog/pandas-python-tutorial/),里面包含两大部分的内容...df.iloc[0,:] 第一行 df.iloc[0,0] 第一列的第一个元素 数据清洗 df.columns = ['a','b','c'] 重命名列 pd.isnull() 检查空值,返回逻辑数组...(col) 从一列返回一组对象的值 df.groupby([col1,col2]) 从多列返回一组对象的值 df.groupby(col1)[col2] 返回col2中的值的平均值,按col1中的值分组...df.describe() 数值列的汇总统计信息 df.mean() 返回所有列的平均值 df.corr() 查找数据框中的列之间的相关性 df.count() 计算每个数据框的列中的非空值的数量 df.max...() 查找每个列中的最大值 df.min() 查找每列中的最小值 df.median() 查找每列的中值 df.std() 查找每个列的标准差 点击“阅读原文”下载此速查卡的打印版本 END.

    9.2K80

    高效的10个Pandas函数,你都用过吗?

    ,则 loc=0 column: 给插入的列取名,如 column='新的一列' value:新列的值,数字、array、series等都可以 allow_duplicates: 是否允许列名重复,选择...Ture表示允许新的列名与已存在的列名重复 接着用前面的df: 在第三列的位置插入新列: #新列的值 new_col = np.random.randn(10) #在第三列位置插入新列,从0开始计算...Where Where用来根据条件替换行或列中的值。如果满足条件,保持原来的值,不满足条件则替换为其他值。默认替换为NaN,也可以指定特殊值。...cond 为真,保持原来的值,否则替换为other other:替换的特殊值 inplace:inplace为真则在原数据上操作,为False则在原数据的copy上操作 axis:行或列 将df中列value...Isin Isin也是一种过滤方法,用于查看某列中是否包含某个字符串,返回值为布尔Series,来表明每一行的情况。

    4.2K20

    python数据分析笔记——数据加载与整理

    2、当文件没有标题行时 可以让pandas为其自动分配默认的列名。 也可以自己定义列名。 3、将某一列作为索引,比如使用message列做索引。通过index_col参数指定’message’。...5、文本中缺失值处理,缺失数据要么是没有(空字符串),要么是用某个标记值表示的,默认情况下,pandas会用一组经常出现的标记值进行识别,如NA、NULL等。查找出结果以NAN显示。...当没有指明用哪一列进行连接时,程序将自动按重叠列的列名进行连接,上述语句就是按重叠列“key”列进行连接。也可以通过on来指定连接列进行连接。...(2)对于pandas对象(如Series和DataFrame),可以pandas中的concat函数进行合并。...默认情况下,此方法是对所有的列进行重复项清理操作,也可以用来指定特定的一列或多列进行。 默认情况下,上述方法保留的是第一个出现的值组合,传入take_last=true则保留最后一个。

    6.1K80

    详解pd.DataFrame中的几种索引变换

    02 reindex和rename 学习pandas之初,reindex和rename容易使人混淆的一组接口,就其具体功能来看: reindex执行的是索引重组操作,接收一组标签序列作为新索引,既适用于行索引也适用于列标签名...index/columns关键字指定作用轴 具体而言,reindex执行索引重组操作,以新接收的一组标签序列作为索引,当原DataFrame中存在该索引时则提取相应行或列,否则赋值为空或填充指定值。...注意到原df中行索引为[1, 3, 5],而新重组的目标索引为[1, 2, 3],其中[1, 3]为已有索引直接提取,[2, 4]在原df中不存在,所以填充空值;同时,原df中索引[5]由于不在指定索引中...03 index.map 针对DataFrame中的数据,pandas中提供了一对功能有些相近的接口:map和apply,以及applymap,其中map仅可用于DataFrame中的一列(也即即Series...用于复位索引——将索引加入到数据中作为一列或直接丢弃,可选drop参数。

    2.5K20

    python数据分析——Python数据分析模块

    ((3, 3)) 返回值:是一个二维数组 关于randint np.random.randint(10) 返回值:仅仅得到一个整数,且得到的整数总是小于10 对前两个参数赋值,注意第二个参数要大于第一个参数的值...由最后一位参数是元组还是列表决定 关于rand np.random.rand(2) np.random.rand(2, 3) 1.2Numpy数组统计方法 Numpy中提供了很多统计函数,可以快速地实现查找数组中的最小值...Pandas是基于Numpy构建的数据分析库,但它比Numpy有更高级的数据结构和分析工具,如Series类型、DataFrame类型等。...第一列是数据的索引,第二列是数据 2.1Pandas数据结构之Series 当Series数组元素为数值时,可以使用Series对象的describe方法对Series数组的数值进行分析 2.2 Pandas...数据结构之DataFrame 如果把Series看作Excel表中的一列,DataFrame就是Excel的一张工作表。

    26310

    懂Excel就能轻松入门Python数据分析包pandas(十):查找替换

    后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器—— pandas 前言 Excel 无疑是数据处理的入门工具,他有许多便捷的功能,但是实际工作中的需求往往是越来越"疯狂",今天我们就来看看如何在...pandas 中实现 Excel 中的查找替换功能,并且最后做到 Excel 所做不到的。...: - 大部分的异常值是 x ,但有一些是 xx Excel 中可以的查找值可以使用通配符,如下可以解决: - 查找值填 "x*" pandas 中,直接可以使用正则表达式,因此完全难不倒你:...如果在 Excel ,这只能手工逐列替换操作。 pandas 中当然不需要: - 第2参数 value ,可以接受一个字典,key 是列名,item 是替换的新值 拒绝繁琐!!...有人就会说:这太傻了吧,我还要每列的新值给写出来,我还不如用 Excel 一列列操作呢。

    1.2K20
    领券