首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

如何从pandas中不包含在另一列中的一列中获取id列表

在pandas中,可以使用isin()函数和布尔索引来获取不包含在另一列中的一列中的id列表。

首先,假设我们有一个名为df的DataFrame,其中包含两列:column1column2。我们想要获取column1中不包含在column2中的id列表。

以下是实现这个目标的步骤:

  1. 导入pandas库:
代码语言:txt
复制
import pandas as pd
  1. 创建一个示例DataFrame:
代码语言:txt
复制
data = {'column1': [1, 2, 3, 4, 5],
        'column2': [3, 4, 5, 6, 7]}
df = pd.DataFrame(data)
  1. 使用isin()函数和布尔索引来获取不包含在column2中的id列表:
代码语言:txt
复制
id_list = df[~df['column1'].isin(df['column2'])]['column1'].tolist()

在上述代码中,~操作符用于取反,isin()函数用于检查column1中的每个元素是否包含在column2中。通过将~df['column1'].isin(df['column2'])作为布尔索引,我们可以获取不包含在column2中的行。最后,使用tolist()函数将结果转换为列表。

完整的代码示例:

代码语言:txt
复制
import pandas as pd

data = {'column1': [1, 2, 3, 4, 5],
        'column2': [3, 4, 5, 6, 7]}
df = pd.DataFrame(data)

id_list = df[~df['column1'].isin(df['column2'])]['column1'].tolist()
print(id_list)

输出结果为:

代码语言:txt
复制
[1, 2]

这样,我们就成功地从column1中获取了不包含在column2中的id列表。

腾讯云相关产品和产品介绍链接地址:

  • 腾讯云官网:https://cloud.tencent.com/
  • 云服务器(CVM):https://cloud.tencent.com/product/cvm
  • 云数据库 MySQL 版:https://cloud.tencent.com/product/cdb_mysql
  • 云原生应用引擎 TKE:https://cloud.tencent.com/product/tke
  • 云存储 COS:https://cloud.tencent.com/product/cos
  • 腾讯云区块链服务:https://cloud.tencent.com/product/tbaas
  • 腾讯云物联网平台:https://cloud.tencent.com/product/iotexplorer
  • 腾讯云移动开发:https://cloud.tencent.com/product/mobdev
  • 腾讯云音视频处理:https://cloud.tencent.com/product/mps
  • 腾讯云人工智能:https://cloud.tencent.com/product/ai
页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

Pandas求某一列每个列表平均值

一、前言 前几天在Python最强王者交流群【冫马讠成】问了一道Pandas处理问题,如下图所示。...原始数据如下: df = pd.DataFrame({ 'student_id': ['S001','S002','S003'], 'marks': [[88,89,90],[78,81,60...],[84,83,91]]}) df 预期结果如下图所示: 二、实现过程 方法一 这里【瑜亮老师】给出一个可行代码,大家后面遇到了,可以对应修改下,事半功倍,代码如下所示: df['dmean...(np.mean) 运行之后,结果就是想要了。...完美的解决了粉丝问题! 三、总结 大家好,我是皮皮。这篇文章主要盘点了一道使用Pandas处理数据问题,文中针对该问题给出了具体解析和代码实现,一共两个方法,帮助粉丝顺利解决了问题。

4.8K10

问与答112:如何查找一列内容是否在另一列并将找到字符添加颜色?

Q:我在D单元格存放着一些数据,每个单元格多个数据使用换行分开,E是对D数据相应描述,我需要在E单元格查找是否存在D数据,并将找到数据标上颜色,如下图1所示。 ?...图1 如何使用VBA代码实现?...A:实现上图1所示效果VBA代码如下: Sub ColorText() Dim ws As Worksheet Dim rDiseases As Range Dim rCell...End If Loop Next iDisease Next rCell End Sub 代码中使用Split函数以回车符来拆分单元格数据并存放到数组...,然后遍历该数组,在E对应单元格中使用InStr函数来查找是否出现了该数组值,如果出现则对该值添加颜色。

7.2K30
  • 问与答63: 如何获取一列数据重复次数最多数据?

    学习Excel技术,关注微信公众号: excelperfect Q:如下图1所示,在工作表列A中有很多数据(为方便表述,示例只放置了9个数据),这些数据中有很多重复数据,我想得到重复次数最多数据是那个...,示例可以看出是“完美Excel”重复次数最多,如何获得这个数据?...在上面的公式: MATCH($A$1:$A$9,$A$1:$A$9,0) 在单元格区域A1:A9依次分别查找A1至A9单元格数据,得到这些数据第1次出现时所在行号,从而形成一个由该区域所有数据第一次出现行号组组成数字数组...MODE函数从上面的数组得到出现最多1个数字,也就是重复次数最多数据在单元格区域所在行。将这个数字作为INDEX函数参数,得到想应数据值。...MyRange,那么上述数组公式可写为: =INDEX(MyRange,MODE(MATCH(MyRange,MyRange,0))) 但是,如果单元格区域中有几个数据重复次数相同且都出现次数最多,则上述公式只会获取

    3.6K20

    直观地解释和可视化每个复杂DataFrame操作

    操作数据帧可能很快会成为一项复杂任务,因此在Pandas八种技术均提供了说明,可视化,代码和技巧来记住如何做。 ?...包含值将转换为两一列用于变量(值名称),另一列用于值(变量包含数字)。 ? 结果是ID值(a,b,c)和值(B,C)及其对应值每种组合,以列表格式组织。...要记住:外观上看,堆栈采用表二维性并将堆栈为多级索引。 Unstack 取消堆叠将获取多索引DataFrame并对其进行堆叠,将指定级别的索引转换为具有相应值新DataFrame。...默认情况下,合并功能执行内部联接:如果每个DataFrame键名均未列在另一个键,则该键含在合并DataFrame。...请注意,concat是pandas函数,而不是DataFrame之一。因此,它接受要连接DataFrame列表。 如果一个DataFrame另一列未包含,默认情况下将包含该,缺失值列为NaN。

    13.3K20

    爬虫入门经典(二十四) | 爬取当当网图书信息并进行数据清洗

    4.1 读取数据 首先,我们借助 Pandas 提供 read_csv 方法读取原始数据,将其转换成 Pandas DataFrame 格式。注意由于数据包含中文,需要正确设置字符编码。...在本demo我们按照步骤完成数据清洗,主要任务为: 1)去掉当前价格这一列 ‘¥’ 符号,转换成数值格式。...上图是不是比较多,所以学长在百科上找到了另一个合集: ? 在Python,re 实现了正则表达式匹配,常用 search 函数能够完成匹配。...4.5 获取出版信息 接下来我们处理出版信息这一列原始数据可以看到,这一列主要包含三个信息,分别是作者、出版日期、出版社。...观察数据后发现,此时已经没有出版信息这一列,说明我们已经删除成功,现在只剩下书名这一列需要处理。 4.6 提取书名和书简介 书名信息混合这书简介信息,观察原始数据书名一列,能找到一些规律。

    4.3K20

    Python与Excel协同应用初学者指南

    可以在下面看到它工作原理: 图15 已经为在特定具有值行检索了值,但是如果要打印文件行而不只是关注一列,需要做什么? 当然,可以使用另一个for循环。...注意,区域选择与选择、获取和索引列表以及NumPy数组元素非常相似,其中还使用方括号和冒号:来指示要获取区域。此外,上面的循环还很好地使用了单元格属性。...另一个for循环,每行遍历工作表所有;为该行一列填写一个值。...下面是一个示例,说明如何使用pyexcel函数get_array()将Excel数据转换为数组格式: 图25 让我们了解一下如何将Excel数据转换为有序列表字典。...要实现这一点,可以使用get_dict()函数,它也包含在pyexcel: 图26 也可以得到二维数组字典。

    17.4K20

    Python科学计算之Pandas

    这是导入Pandas标准方式。显然,我们希望每时每刻都在程序写’pandas’,但是保持代码简洁、避免命名冲突还是相当重要。因而我们折衷一下,用‘pd’代替“pandas’。...类似于head,我们只需要调用tail函数并传入我们想获取行数。需要注意是,Pandas不是dataframe结尾处开始倒着输出数据,而是按照它们在dataframe中固有的顺序输出给你。...这将会给’water_year’一个新索引值。注意到列名虽然只有一个元素,却实际上需要包含于一个列表。如果你想要多个索引,你可以简单地在列表增加另一个列名。 ?...Pandas对此给出了两个非常有用函数,apply和applymap。 ? 这会创建一个名为‘year‘。这一列是由’water_year’所导出。它获取是主年份。...这便是使用apply方法,即如何一列应用一个函数。如果你想对整个数据集应用某个函数,你可以使用dataset.applymap()。

    2.9K00

    PySpark︱DataFrame操作指南:增删改查合并统计与数据处理

    ---- 文章目录 1、-------- 查 -------- --- 1.1 行元素查询操作 --- **像SQL那样打印列表前20元素** **以树形式打印概要** **获取头几行到本地:**...**查询总行数:** 取别名 **查询某列为null行:** **输出list类型,list每个元素是Row类:** 查询概况 去重set操作 随机抽样 --- 1.2 元素操作 --- **获取...行元素查询操作 — 像SQL那样打印列表前20元素 show函数内可用int类型指定要打印行数: df.show() df.show(30) 以树形式打印概要 df.printSchema() 获取头几行到本地...— 获取Row元素所有列名: r = Row(age=11, name='Alice') print r.columns # ['age', 'name'] 选择一列或多:select df...,一列为分组组名,另一列为行总数 max(*cols) —— 计算每组中一列或多最大值 mean(*cols) —— 计算每组中一列或多平均值 min(*cols) ——

    30.4K10

    挑战30天学完Python:Day25 数据分析Pandas

    请看下面的表格,它比上面的例子有更多表列: 接下来,我们将了解如何导入pandas,以及如何使用pandas创建 Series 和 dataframe 引入 Pandas import pandas...DataFrames 可以通过以下不同方式进行创建 二维列表创建 data = [ ['Asabeneh', 'Finland', 'Helsink'], ['David',...9997 63.867992 9998 69.034243 9999 61.944246 Name: Height, Length: 10000, dtype: float64 其他如法炮制均可通过头关键词获取一列值... 改变 DataFrame 数据类型 创建 像往常一样,首先我们要导入依赖。.../data/hacker_news.csv 文件 获取前5行数据 获取最后5行数据 获得标题,数据作为一个pandas series返回 计算这个dataframe行和个数 过滤包含python标题

    26210

    Pandas最详细教程来了!

    作者:赵志强 刘志伟 来源:大数据DT(ID:hzdashuju) ? 在使用Pandas之前,需要导入Pandas。...标签,表头A、B、C就是标签部分,代表了每一列名称。 下文列出了DataFrame函数常用参数。其中,“类似列表”代表类似列表形式,比如列表、元组、ndarray等。...可以传给DataFrame构造器数据: 二维ndarray:可以自行指定索引和标签 嵌套列表或者元组:类似于二维ndarray 数据、列表或元组组成字典:每个序列变成一列。...为了保留df2索引为z值,我们可以提供一个参数,告诉Pandas如何连接。示例代码如下: df.join(df2,how='outer') 运行结果如图3-10所示。 ?...在输出Series对象时候,左边一列是索引,右边一列是值。由于没有指定索引,因此会自动创建0到(N-1)整数索引。也可以通过Seriesvalues和index属性获取其值和索引。

    3.2K11

    【小白必看】Python爬虫数据处理与可视化

    前言 本文分析了一段Python代码,主要功能是网页中提取数据并进行数据处理与可视化。代码通过发送HTTP请求获取网页内容,使用XPath解析网页内容,并提取所需数据。...datas 使用pandas.DataFrame()方法将二维列表转换为DataFrame对象df,每分别命名为'类型'、'书名'、'作者'、'字数'、'推荐' 将'推荐'数据类型转换为整型 数据统计与分组...]) # 将每个配对数据以列表形式添加到datas列表, # count[:-1]表示去掉count末尾字符(单位) df = pd.DataFrame(datas, columns...=['类型', '书名', '作者', '字数', '推荐']) # 使用pandas库将二维列表datas转换为DataFrame对象df,并为每一列命名 df['推荐'] = df['推荐'].astype...对象df,并为每一列命名 df.to_excel('data.xlsx', index=False) # 将DataFrame保存为Excel文件,文件名为data.xlsx,包含索引 结束语

    14110

    删除重复值,不只Excel,Python pandas更行

    我们将了解如何使用不同技术处理这两种情况。 整个表删除重复项 Python提供了一个方法.drop_duplicates()可以帮助我们轻松删除重复项!...如果我们指定inplace=True,那么原始df将替换为新数据框架,并删除重复项。 图5 在列表或数据表列查找唯一值 有时,我们希望在数据框架列表查找唯一值。...数据框架是一个表或工作表,而pandas Series是该表/表一列。换句话说,数据框架由各种系列组成。...当我们对pandas Series对象调用.unique()时,它将返回该唯一元素列表。...图7 Python集 获取唯一值另一种方法是使用Python数据结构set,集(set)基本上是一组唯一项集合。由于集只包含唯一项,如果我们将重复项传递到集中,这些重复项将自动删除。

    6K30

    Pandas 数据结构

    Series 是一种类似于一维数组对象,由一组数据及一组数据标签(即索引)组成。 第一列是 数据标签(索引);第二是 具体数据。 2.为什么? 3.怎么做?...导: import pandas as pd (1)创建一个Series:使用 Series()方法 1)传入一个列表list: 只传入一个列表指定数据标签,那么 Series会默认使用0开始数作为数据标签...(1)创建一个 DataFrame 1)传入一个列表list: 只传入一个单一列表时,该列表值会显示成一列,且行和都是0开始默认索引。...行和都是0开始默认索引。 df2 = pd.DataFrame([ ['a','A'],['b','B'],['c','C'] ] ) df2 列表里面嵌套列表也可以换成元组。...,行、索引都是0开始默认值。

    1.1K30

    python数据科学系列:pandas入门详细教程

    与此同时,series因为只有一列,所以数据类型自然也就只有一种,pandas为了兼容二者,series数据类型属性既可以用dtype也可以用dtypes获取;而dataframe则只能用dtypes...这里提到了index和columns分别代表行标签和标签,就不得不提到pandas另一个数据结构:Index,例如series中标签、dataframe中行标签和标签均属于这种数据结构。...自然毫无悬念 dataframe:无法访问单个元素,只能返回一列、多或多行:单值或多值(多个列名组成列表)访问时按进行查询,单值访问不存在列名歧义时还可直接用属性符号" ....pandas另一大类功能是数据分析,通过丰富接口,可实现大量统计需求,包括Excel和SQL大部分分析过程,在pandas均可以实现。...例如,以某取值为重整后行标签,以另一列取值作为重整后标签,以其他取值作为填充value,即实现了数据表行列重整。

    13.9K20
    领券