开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

如何从pandas中不包含在另一列中的一列中获取id列表

在pandas中，可以使用isin()函数和布尔索引来获取不包含在另一列中的一列中的id列表。

首先，假设我们有一个名为df的DataFrame，其中包含两列：column1和column2。我们想要获取column1中不包含在column2中的id列表。

以下是实现这个目标的步骤：

导入pandas库：

import pandas as pd

创建一个示例DataFrame：

data = {'column1': [1, 2, 3, 4, 5],
        'column2': [3, 4, 5, 6, 7]}
df = pd.DataFrame(data)

使用isin()函数和布尔索引来获取不包含在column2中的id列表：

id_list = df[~df['column1'].isin(df['column2'])]['column1'].tolist()

在上述代码中，~操作符用于取反，isin()函数用于检查column1中的每个元素是否包含在column2中。通过将~df['column1'].isin(df['column2'])作为布尔索引，我们可以获取不包含在column2中的行。最后，使用tolist()函数将结果转换为列表。

完整的代码示例：

import pandas as pd

data = {'column1': [1, 2, 3, 4, 5],
        'column2': [3, 4, 5, 6, 7]}
df = pd.DataFrame(data)

id_list = df[~df['column1'].isin(df['column2'])]['column1'].tolist()
print(id_list)

输出结果为：

[1, 2]

这样，我们就成功地从column1中获取了不包含在column2中的id列表。

腾讯云相关产品和产品介绍链接地址：

腾讯云官网：https://cloud.tencent.com/
云服务器（CVM）：https://cloud.tencent.com/product/cvm
云数据库 MySQL 版：https://cloud.tencent.com/product/cdb_mysql
云原生应用引擎 TKE：https://cloud.tencent.com/product/tke
云存储 COS：https://cloud.tencent.com/product/cos
腾讯云区块链服务：https://cloud.tencent.com/product/tbaas
腾讯云物联网平台：https://cloud.tencent.com/product/iotexplorer
腾讯云移动开发：https://cloud.tencent.com/product/mobdev
腾讯云音视频处理：https://cloud.tencent.com/product/mps
腾讯云人工智能：https://cloud.tencent.com/product/ai

相关搜索:Pandas :从另一列中的字典列表创建新列如何使用列表中包含的另一列中的单词创建pandas列如何从pandas数据帧中另一列的多个值创建列中的值列表？删除一列完全包含在另一列中的行根据另一列从pandas数据帧中的列的每个列表中移除元素从表列中获取最大值，用于从另一列中关联的id 从基于另一列的列中获取vlaue 根据另一列中的值从pandas列的列表中提取元素如何根据另一列的值在pandas中获取新列？Pandas根据一列的值列表查找另一列中的值 pandas:从另一列修改dataframe中的值获取Pandas中唯一列表的计数用pandas dataframe中另一列中的值替换空列表 Excel VBA:获取另一列中的数据列表从表中获取列，同时使用另一列中的信息使用PANDAS从另一列中的行操作新建列根据一列中的值从另一列中减去另一列中的值(TSQL)在pandas DataFrame中给定一列中的值的列表，如何从同一行中的另一列输出值？Python pandas在另一列的元素列表中查找一列的元素从pandas DataFrame列为另一列中的值范围生成值列表

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

Pandas中求某一列中每个列表的平均值

一、前言前几天在Python最强王者交流群【冫马讠成】问了一道Pandas处理的问题，如下图所示。...原始数据如下： df = pd.DataFrame({ 'student_id': ['S001','S002','S003'], 'marks': [[88,89,90],[78,81,60...],[84,83,91]]}) df 预期的结果如下图所示：二、实现过程方法一这里【瑜亮老师】给出一个可行的代码，大家后面遇到了，可以对应的修改下，事半功倍，代码如下所示： df['dmean...(np.mean) 运行之后，结果就是想要的了。...完美的解决了粉丝的问题！三、总结大家好，我是皮皮。这篇文章主要盘点了一道使用Pandas处理数据的问题，文中针对该问题给出了具体的解析和代码实现，一共两个方法，帮助粉丝顺利解决了问题。

4.8K1 0

问与答112：如何查找一列中的内容是否在另一列中并将找到的字符添加颜色？

Q：我在列D的单元格中存放着一些数据，每个单元格中的多个数据使用换行分开，列E是对列D中数据的相应描述，我需要在列E的单元格中查找是否存在列D中的数据，并将找到的数据标上颜色，如下图1所示。 ?...图1 如何使用VBA代码实现？...A：实现上图1中所示效果的VBA代码如下： Sub ColorText() Dim ws As Worksheet Dim rDiseases As Range Dim rCell...End If Loop Next iDisease Next rCell End Sub 代码中使用Split函数以回车符来拆分单元格中的数据并存放到数组中...，然后遍历该数组，在列E对应的单元格中使用InStr函数来查找是否出现了该数组中的值，如果出现则对该值添加颜色。

7.2K3 0

Excel应用实践19：根据工作表某列中的值从另一工作簿中获取数据

excelperfect 在下图1所示的工作簿Data.xlsx的工作表Sheet1中，存放着待使用的数据。 ?...图1 在下图2所示的工作簿GetData.xlsm中，根据列C中的数据，在上图1的工作簿Data.xlsx的列E中查找是否存在相应数据的单元格。 ?...图2 然后，将Data.xlsx中对应行的列I至列K单元格中的数据复制到GetData.xlsm相应的单元格中，如下图3所示。 ?...Set wksData =Workbooks("Data.xlsx").Sheets("Sheet1") '判断所选单元格是否在列C中 If ActiveCell.Column... 3 Then MsgBox ("请选择列C中的单元格或单元格区域.")

18.8K3 0

问与答63：如何获取一列数据中重复次数最多的数据？

学习Excel技术，关注微信公众号： excelperfect Q：如下图1所示，在工作表列A中有很多数据（为方便表述，示例中只放置了9个数据），这些数据中有很多重复数据，我想得到重复次数最多的数据是那个...，示例中可以看出是“完美Excel”重复的次数最多，如何获得这个数据？...在上面的公式中： MATCH($A$1:$A$9,$A$1:$A$9,0) 在单元格区域A1:A9中依次分别查找A1至A9单元格中的数据，得到这些数据第1次出现时所在的行号，从而形成一个由该区域所有数据第一次出现的行号组组成的数字数组...MODE函数从上面的数组中得到出现最多的1个数字，也就是重复次数最多的数据在单元格区域所在的行。将这个数字作为INDEX函数的参数，得到想应的数据值。...MyRange，那么上述数组公式可写为： =INDEX(MyRange,MODE(MATCH(MyRange,MyRange,0))) 但是，如果单元格区域中有几个数据重复次数相同且都出现次数最多，则上述公式只会获取第

3.6K2 0

直观地解释和可视化每个复杂的DataFrame操作

操作数据帧可能很快会成为一项复杂的任务，因此在Pandas中的八种技术中均提供了说明，可视化，代码和技巧来记住如何做。 ?...包含值的列将转换为两列：一列用于变量（值列的名称），另一列用于值（变量中包含的数字）。 ? 结果是ID列的值（a，b，c）和值列（B，C）及其对应值的每种组合，以列表格式组织。...要记住：从外观上看，堆栈采用表的二维性并将列堆栈为多级索引。 Unstack 取消堆叠将获取多索引DataFrame并对其进行堆叠，将指定级别的索引转换为具有相应值的新DataFrame的列。...默认情况下，合并功能执行内部联接：如果每个DataFrame的键名均未列在另一个键中，则该键不包含在合并的DataFrame中。...请注意，concat是pandas函数，而不是DataFrame之一。因此，它接受要连接的DataFrame列表。如果一个DataFrame的另一列未包含，默认情况下将包含该列，缺失值列为NaN。

13.3K2 0

python pandas 基础之一

import pandas as pd import numpy as np s=pd.Series([12,2,3,4]) 声明Series时，若不指定标签，默认从0开始。也可以指定标签。...value_counts(), 返回各个不同的元素，并计算元素在Series中的个数。 isin(), 用来判断所属关系，判断给定的一列元素是否包含在Series数据结构中。isin()返回布尔值。...获取索引的列表：frame.index 获取所有的元素：frame.values 获取一列，用列名称即可：frame['price'],返回一个Series对象另一种获取列的方法：frame.price...赋值：用name属性为index和columns指定名字 frame.index.name='id' frame.columns.name='item' 添加一列： frame['new']=12 frame...['new']=[23,45,67] 修改某一列的值类似。

1.4K5 0

爬虫入门经典(二十四) | 爬取当当网图书信息并进行数据清洗

4.1 读取数据首先，我们借助 Pandas 包提供的 read_csv 方法读取原始数据，将其转换成 Pandas 中的 DataFrame 格式。注意由于数据中包含中文，需要正确设置字符编码。...在本demo中我们按照步骤完成数据清洗，主要任务为： 1）去掉当前价格这一列中的 ‘￥’ 符号，转换成数值格式。...上图是不是比较多，所以学长在百科上找到了另一个合集： ? 在Python中，re 包实现了正则表达式的匹配，常用的 search 函数能够完成匹配。...4.5 获取出版信息接下来我们处理出版信息这一列，从原始数据中可以看到，这一列主要包含三个信息，分别是作者、出版日期、出版社。...观察数据后发现，此时已经没有出版信息这一列，说明我们已经删除成功，现在只剩下书名这一列需要处理。 4.6 提取书名和书简介书名信息中混合这书的简介信息，观察原始数据中书名一列，能找到一些规律。

4.3K2 0

Python与Excel协同应用初学者指南

可以在下面看到它的工作原理：图15 已经为在特定列中具有值的行检索了值，但是如果要打印文件的行而不只是关注一列，需要做什么？当然，可以使用另一个for循环。...注意，区域的选择与选择、获取和索引列表以及NumPy数组元素非常相似，其中还使用方括号和冒号：来指示要获取值的区域。此外，上面的循环还很好地使用了单元格属性。...另一个for循环，每行遍历工作表中的所有列；为该行中的每一列填写一个值。...下面是一个示例，说明如何使用pyexcel包中的函数get_array()将Excel数据转换为数组格式：图25 让我们了解一下如何将Excel数据转换为有序的列表字典。...要实现这一点，可以使用get_dict()函数，它也包含在pyexcel包中：图26 也可以得到二维数组的字典。

17.4K2 0

Python科学计算之Pandas

这是导入Pandas的标准方式。显然，我们不希望每时每刻都在程序中写’pandas’，但是保持代码简洁、避免命名冲突还是相当重要的。因而我们折衷一下，用‘pd’代替“pandas’。...类似于head，我们只需要调用tail函数并传入我们想获取的行数。需要注意的是，Pandas不是从dataframe的结尾处开始倒着输出数据，而是按照它们在dataframe中固有的顺序输出给你。...这将会给’water_year’一个新的索引值。注意到列名虽然只有一个元素，却实际上需要包含于一个列表中。如果你想要多个索引，你可以简单地在列表中增加另一个列名。 ?...Pandas对此给出了两个非常有用的函数，apply和applymap。 ? 这会创建一个名为‘year‘的新列。这一列是由’water_year’列所导出的。它获取的是主年份。...这便是使用apply的方法，即如何对一列应用一个函数。如果你想对整个数据集应用某个函数，你可以使用dataset.applymap()。

2.9K0 0

PySpark︱DataFrame操作指南：增删改查合并统计与数据处理

---- 文章目录 1、-------- 查 -------- --- 1.1 行元素查询操作 --- **像SQL那样打印列表前20元素** **以树的形式打印概要** **获取头几行到本地：**...**查询总行数：** 取别名 **查询某列为null的行：** **输出list类型，list中每个元素是Row类：** 查询概况去重set操作随机抽样 --- 1.2 列元素操作 --- **获取...行元素查询操作 — 像SQL那样打印列表前20元素 show函数内可用int类型指定要打印的行数： df.show() df.show(30) 以树的形式打印概要 df.printSchema() 获取头几行到本地...— 获取Row元素的所有列名： r = Row(age=11, name='Alice') print r.columns # ['age', 'name'] 选择一列或多列：select df...，一列为分组的组名，另一列为行总数 max(*cols) —— 计算每组中一列或多列的最大值 mean(*cols) —— 计算每组中一列或多列的平均值 min(*cols) ——

30.4K1 0

挑战30天学完Python：Day25 数据分析Pandas

请看下面的表格,它比上面的例子有更多的表列: 接下来，我们将了解如何导入pandas，以及如何使用pandas创建 Series 和 dataframe 引入 Pandas import pandas...DataFrames 可以通过以下不同的方式进行创建从二维列表中创建 data = [ ['Asabeneh', 'Finland', 'Helsink'], ['David',...9997 63.867992 9998 69.034243 9999 61.944246 Name: Height, Length: 10000, dtype: float64 其他列如法炮制均可通过列头关键词获取一列值...的列改变 DataFrame 列的数据类型创建像往常一样，首先我们要导入依赖包。.../data/hacker_news.csv 文件获取前5行数据获取最后5行数据获得标题，数据作为一个pandas series返回计算这个dataframe的行和列个数过滤包含python的标题

2621 0

Pandas最详细教程来了！

作者：赵志强刘志伟来源：大数据DT（ID：hzdashuju） ? 在使用Pandas之前，需要导入Pandas包。...列标签，表头的A、B、C就是标签部分，代表了每一列的名称。下文列出了DataFrame函数常用的参数。其中，“类似列表”代表类似列表的形式，比如列表、元组、ndarray等。...可以传给DataFrame构造器的数据：二维ndarray：可以自行指定索引和列标签嵌套列表或者元组：类似于二维ndarray 数据、列表或元组组成的字典：每个序列变成一列。...为了保留df2中索引为z的值，我们可以提供一个参数，告诉Pandas如何连接。示例代码如下： df.join(df2,how='outer') 运行结果如图3-10所示。 ?...在输出Series对象的时候，左边一列是索引，右边一列是值。由于没有指定索引，因此会自动创建0到（N-1）的整数索引。也可以通过Series的values和index属性获取其值和索引。

3.2K1 1

【小白必看】Python爬虫数据处理与可视化

前言本文分析了一段Python代码，主要功能是从网页中提取数据并进行数据处理与可视化。代码通过发送HTTP请求获取网页内容，使用XPath解析网页内容，并提取所需数据。...datas 使用pandas.DataFrame()方法将二维列表转换为DataFrame对象df，每列分别命名为'类型'、'书名'、'作者'、'字数'、'推荐' 将'推荐'列的数据类型转换为整型数据统计与分组...]) # 将每个配对的数据以列表形式添加到datas列表中， # count[:-1]表示去掉count末尾的字符（单位） df = pd.DataFrame(datas, columns...=['类型', '书名', '作者', '字数', '推荐']) # 使用pandas库将二维列表datas转换为DataFrame对象df，并为每一列命名 df['推荐'] = df['推荐'].astype...对象df，并为每一列命名 df.to_excel('data.xlsx', index=False) # 将DataFrame保存为Excel文件，文件名为data.xlsx，不包含索引列结束语

1411 0

Pandas常用操作

其中每个文件的内容如图2，要求合并时去除第一列，第二列这两个无用列。...步骤代码如下： 1.构建文件列表和要读取的文件列名称 import os import pandas as pd file_dir = r'D:\公众号\Pandas基本操作' #设置工作空间，默认读取的就是这个文件夹下的文件...pd.read_csv(file_ls[0]) #读取文件列表第一个文件的全部数据 use_cols = df.columns[2:] #获取要读取的列名，因为有两列是无用列 print(use_cols...pd.Series语法将列表转为Series格式，如果不转换，将会报错，提示行不匹配。...= df['new_id'].fillna('-1') df['new_id'] = new_col 方法一利用pd.isnull判断某一列中为NaN的行，利用.index得到行索引。

1.4K1 0

Pandas从入门到放弃

，DataFrame的每一列（行）都是一个Series，每一列（行）的Series.name即为当前列（或行）索引名。...，获取的永远是列，索引只会被认为是列索引，而不是行索引；相反，第二种方式没有此类限制，故在使用中容易出现问题。...[] Pandas与NumPy异同 1）Numpy是数值计算的扩展包，能够高效处理N维数组，即处理高维数组或矩阵时会方便。...Pandas是python的一个数据分析包，主要是做数据处理用的，以处理二维表格为主。...2）Numpy只能存储相同类型的ndarray，Pandas能处理不同类型的数据，例如二维表格中不同列可以是不同类型的数据，一列为整数一列为字符串。

961 0

删除重复值，不只Excel，Python pandas更行

我们将了解如何使用不同的技术处理这两种情况。从整个表中删除重复项 Python提供了一个方法.drop_duplicates()可以帮助我们轻松删除重复项！...如果我们指定inplace=True，那么原始的df将替换为新的数据框架，并删除重复项。图5 在列表或数据表列中查找唯一值有时，我们希望在数据框架列的列表中查找唯一值。...数据框架是一个表或工作表，而pandas Series是该表/表中的一列。换句话说，数据框架由各种系列组成。...当我们对pandas Series对象调用.unique()时，它将返回该列中唯一元素的列表。...图7 Python集获取唯一值的另一种方法是使用Python中的数据结构set，集(set)基本上是一组唯一项的集合。由于集只包含唯一项，如果我们将重复项传递到集中，这些重复项将自动删除。

6K3 0

【Python】这25个Pandas高频实用技巧，不得不服！

按列从多个文件中构建DataFrame 上一个技巧对于数据集中每个文件包含行记录很有用。但是如果数据集中的每个文件包含的列信息呢？...，这个方法在索引值不唯一的情况下不起作用。...类似地，你可以通过mean()和isna()函数找出每一列中缺失值的百分比。...':[[10, 40], [20, 50], [30, 60]]}) df 这里有两列，第二列包含了Python中的由整数元素组成的列表。...它会返回一个互动的HTML报告：第一部分为该数据集的总览，以及该数据集可能出现的问题列表；第二部分为每一列的总结。

6.6K5 0

Pandas 数据结构

Series 是一种类似于一维数组的对象，由一组数据及一组数据标签（即索引）组成。第一列是数据标签（索引）；第二列是具体数据。 2.为什么？ 3.怎么做？...导包： import pandas as pd （1）创建一个Series：使用 Series()方法 1）传入一个列表list：只传入一个列表不指定数据标签，那么 Series会默认使用从0开始的数作为数据标签...（1）创建一个 DataFrame 1）传入一个列表list：只传入一个单一列表时，该列表的值会显示成一列，且行和列都是从0开始的默认索引。...行和列都是从0开始的默认索引。 df2 = pd.DataFrame([ ['a','A'],['b','B'],['c','C'] ] ) df2 列表里面嵌套的列表也可以换成元组。...，行、列索引都是从0开始的默认值。

1.1K3 0

Pandas 第一轮零基础扫盲

Series：真正的数据是只有一列的，索引列我们是不算进去的。...'] # data[1] Out[12]: 3 获取数组中多个数据「不连续」「第一个中括号：告诉程序说，我要索引一下；第二个中括号：用来获取多个数据，一个数据则不用」 In [13]: data[['k...按列填写缺失值，如果存在着不填。」...Gender Score Student Age b F 100 hanmeimei NaN c M 135 aiyuechuang NaN 从列表中筛选数据...', 'book_id', 'rating']) 读取 CSV 文件，指定索引列「有可能我都某一列是我们的索引列，所以这个时候需要指定索引列」 data = pd.read_csv('rating.csv

2.2K0 0

python数据科学系列：pandas入门详细教程

与此同时，series因为只有一列，所以数据类型自然也就只有一种，pandas为了兼容二者，series的数据类型属性既可以用dtype也可以用dtypes获取；而dataframe则只能用dtypes...这里提到了index和columns分别代表行标签和列标签，就不得不提到pandas中的另一个数据结构：Index，例如series中标签列、dataframe中行标签和列标签均属于这种数据结构。...自然毫无悬念 dataframe：无法访问单个元素，只能返回一列、多列或多行：单值或多值（多个列名组成的列表）访问时按列进行查询，单值访问不存在列名歧义时还可直接用属性符号" ....pandas中的另一大类功能是数据分析，通过丰富的接口，可实现大量的统计需求，包括Excel和SQL中的大部分分析过程，在pandas中均可以实现。...例如，以某列取值为重整后行标签，以另一列取值作为重整后的列标签，以其他列取值作为填充value，即实现了数据表的行列重整。

13.9K2 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭