首页
学习
活动
专区
圈层
工具
发布

大佬们,如何把某一列中包含某个值的所在行给删除

一、前言 前几天在Python白银交流群【上海新年人】问了一个Pandas数据处理的问题,一起来看看吧。 大佬们,如何把某一列中包含某个值的所在行给删除?比方说把包含电力这两个字的行给删除。...二、实现过程 这里【莫生气】给了一个思路和代码: # 删除Column1中包含'cherry'的行 df = df[~df['Column1'].str.contains('电力')] 经过点拨,顺利地解决了粉丝的问题...顺利地解决了粉丝的问题。 但是粉丝还有其他更加复杂的需求,其实本质上方法就是上面提及的,如果你想要更多的话,可以考虑下从逻辑 方面进行优化,如果没有的话,正向解决,那就是代码的堆积。...这里给大家分享下【瑜亮老师】的金句:当你"既要,又要,还要"的时候,代码就会变长。...这篇文章主要盘点了一个Pandas数据处理的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。

1.8K10

如何使用Excel将某几列有值的标题显示到新列中

如果我们有好几列有内容,而我们希望在新列中将有内容的列的标题显示出来,那么我们怎么做呢? Excel - TEXTJOIN function 1....- - - - 4 - - - 在开始,我们曾经使用INDEX + MATCH的方式,但是没有成功,一直是N/A https://superuser.com/questions/1300246/if-cell-contains-value-then-column-header...所以我们后来改为TEXTJOIN函数,他可以显示值,也可以显示值的标题,还可以多个列有值的时候同时显示。...- - 4 - - - 15 Year 5 - - - - 5 - - - =TEXTJOIN(", ",TRUE,IF(ISNUMBER(B2:I2),$B$1:$I$1,"")) 如果是想要显示值,...则: =TEXTJOIN(", ",TRUE,IF(ISNUMBER(B2:I2),B2:I2,"")) 其中,ISNUMBER(B2:I2)是判断值是不是数字,可以根据情况改成是不是空白ISBLANK

16.2K40
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    pandas库的简单介绍(2)

    另外一个构建的方式是字典嵌套字典构造DataFrame数据;嵌套字典赋给DataFrame,pandas会把字典的键作为列,内部字典的键作为索引。...计算两个索引的交集 union 计算两个索引的并集 delete 将位置i的元素删除,并产生新的索引 drop 根据传入的参数删除指定索引值,并产生新索引 unique 计算索引的唯一值序列 is_nuique...不常用的特性感兴趣的可自行探索。 4.1 重建索引 reindex是pandas对象的重要方法,该方法创建一个符合条件的新对象。...如果某个索引值之前并不存在,则会引入缺失值;在这里注意与上一篇文章2.2的区别。 对于顺序数据,例如时间序列,重建索引时可能会需要进行插值或填值。...在DataFrame中,reindex可以改变行索引、列索引,当仅传入一个序列,会默认重建行索引。

    2.7K10

    Python数据分析-pandas库入门

    使用 NumPy 函数或类似 NumPy 的运算(如根据布尔型数组进行过滤、标量乘法、应用数学函数等)都会保留索引值的链接,代码示例: obj2*2 np.exp(obj2) 还可以将 Series...DataFrame 既有行索引也有列索引,它可以被看做由 Series 组成的字典(共用同一个索引)。DataFrame 中的数据是以一个或多个二维块存放的(而不是列表、字典或别的一维数据结构)。...例如,我们可以给那个空的 “debt” 列赋上一个标量值或一组值(数组或列表形式),代码示例: frame2.debt = np.arange(6.) frame2 注意:将列表或数组赋值给某个列时,...作为 del 的例子,这里先添加一个新的布尔值的列,state 是否为 ‘Ohio’,代码示例: frame2['eastern'] = frame2.state=='Ohio' frame2 DataFrame...作为 pandas 库的基本结构的一些特性,如何创建 pandas 对象、指定 columns 和 index 创建 Series 和 DataFrame 对象、赋值操作、属性获取、索引对象等,这章介绍操作

    4.3K20

    pandas数据清洗,排序,索引设置,数据选取

    df.fillna({1:0,2:0.5}) #对第一列nan值赋0,第二列赋值0.5 df.fillna(method='ffill') #在列方向上以前一个值作为值赋给NaN 值替换replace(...) # 将df的A列中 -999 全部替换成空值 df['A'].replace(-999, np.nan) #-999和1000 均替换成空值 obj.replace([-999,1000], np.nan...中某个索引值不存在,会自动补上NaN df2 = df1.reindex(['a','b','c','d','e']) # fill_valuse为原先不存在的索引补上默认值,不在是NaN df2 =...","California"] df2 = df1.reindex( columns=states ) set_index() 将DataFrame中的列columns设置成索引index 打造层次化索引的方法...# 将columns中的其中两列:race和sex的值设置索引,race为一级,sex为二级 # inplace=True 在原数据集上修改的 adult.set_index(['race','sex

    3.7K20

    Python 数据处理:Pandas库的使用

    例如,可以给那个空的"debt"列赋上一个标量值或一组值: import pandas as pd data = {'state': ['Ohio', 'Ohio', 'Ohio', 'Nevada...frame2['debt'] = 16.5 print(frame2) import numpy as np frame2['debt'] = np.arange(6.) print(frame2) 将列表或数组赋值给某个列时...计算并集 isin 计算一个指示各值是否都包含在参数集合中的布尔型数组 delete 删除索引i处的元素,并得到新的Index drop 删除传入的值,并得到新的Index insert 将元素插入到索引...和Series之间的算术运算会将Series的索引匹配到DataFrame的列,然后沿着行一直向下广播: print(frame - series) 如果某个索引值在DataFrame的列或Series...时,你可能希望根据一个或多个列中的值进行排序。

    24.7K10

    Python数据分析笔记——Numpy、Pandas库

    3、基本的索引和切片 (1)元素索引、根据元素在数组中的位置来进行索引。...(3)获取DataFrame的值(行或列) 通过查找columns值获取对应的列。(下面两种方法) 通过索引字段ix查找相应的行。 (4)对列进行赋值处理。 对某一列可以赋一个标量值也可以是一组值。...也可以给某一列赋值一个列表或数组,其长度必须跟DataFrame长度相匹配。如果赋值的是一个Series,则对应的索引位置将被赋值,其他位置的值被赋予空值。...Pandas基本功能 1、重新索引 Pandas对象的一个方法就是重新索引(reindex),其作用是创建一个新的索引,pandas对象将按这个新索引进行排序。对于不存在的索引值,引入缺失值。...obj.rank() (2)DataFrame数据结构的排序和排名 按索引值进行排列,一列或多列中的值进行排序,通过by将列名传递给sort_index. 5、缺失数据处理 (1)滤出缺失数据 使用data.dropna

    7.3K80

    pandas

    1961/1/8 0:00:00 4.pandas中series与DataFrame区别 Series是带索引的一维数组 Series对象的两个重要属性是:index(索引)和value(数据值)...列中的日期转换为没有时分秒的日期 df.to_excel("dates.xlsx") 向pandas中插入数据 如果想忽略行索引插入,又不想缺失数据与添加NaN值,建议使用 df['column_name...'].values得出的是ndarray类型的值,后面的操作就不会限制于索引了 # waterlevel_data_trainx.values是一维数组 new_df['新列名'] =...df.drop(columns =['C', 'D']) 根据列索引删除列 # Import pandas package import pandas as pd    # create a dictionary...通常情况下, 因为.T的简便性, 更常使用.T属性来进行转置 注意 转置不会影响原来的数据,所以如果想保存转置后的数据,请将值赋给一个变量再保存。

    1.6K10

    Pandas数据分析包

    index Index的方法和属性 ? method1 ? method2 基本功能 重新索引 • 创建一个适应新索引的新对象,该Series的reindex将会根据新索引进行重排。...如果某个索引值当前不存在,就引入缺失值 • 对于时间序列这样的有序数据,重新索引时可能需要做一些插值处理。method选项即可达到此目的。 ?...对于DataFrame,根据任意一个轴上的索引进行排序 可以指定升序降序 按值排序 对于DataFrame,可以指定按值排序的列 rank函数 # -*- coding: utf-8 -*- import...pandas的数据处理常用方法总结 Series和DataFrame排序 Series排序 sort_values根据值大小排序,默认是升序 sort_index 根据索引排序 DataFrame排序...sort_values根据值大小排序,默认是升序 重命名DataFrame的Index df.index = Series(list('abc'))直接赋一个新值 df.index = df.index.map

    3.3K71

    《利用Python进行数据分析·第2版》第5章 pandas入门5.1 pandas的数据结构介绍5.2 基本功能5.3 汇总和计算描述统计5.4 总结

    例如,我们可以给那个空的"debt"列赋上一个标量值或一组值: In [54]: frame2['debt'] = 16.5 In [55]: frame2 Out[55]: year...5.2 基本功能 本节中,我将介绍操作Series和DataFrame中的数据的基本手段。后续章节将更加深入地挖掘pandas在数据分析和处理方面的功能。...将会根据新索引进行重排。...笔记:在一开始设计pandas时,我觉得用frame[:, col]选取列过于繁琐(也容易出错),因为列的选择是非常常见的操作。我做了些取舍,将花式索引的功能(标签和整数)放到了ix运算符中。...后面的频率值是每个列中这些值的相应计数。 5.4 总结 在下一章,我们将讨论用pandas读取(或加载)和写入数据集的工具。

    6.5K70

    数据科学家私藏pandas高阶用法大全 ⛵

    大家都知道,我们可以使用value_counts获取列里的取值计数,但是,如果要获取列中某个值的百分比,我们可以添加normalize=True至value_counts参数设置来完成: import...() 类似于上例,如果你想把一个DataFrame中某个字符串字段(列)展开为一个列表,然后将列表中的元素拆分成多行,可以使用str.split()和explode()组合,如下例: import pandas...combine_first()方法根据 DataFrame 的行索引和列索引,对比两个 DataFrame 中相同位置的数据,优先取非空的数据进行合并。...中的列 我们可以根据名称中的子字符串过滤 pandas DataFrame 的列,具体是使用 pandas 的DataFrame.filter功能。...DataFrame 在我们处理数据的时候,有时需要根据某个列进行计算得到一个新列,以便后续使用,相当于是根据已知列得到新的列,这个时候assign函数非常方便。

    6.6K30

    数据分析篇 | PyCon 大咖亲传 pandas 25 式,长文建议收藏

    ~ 按行 用多个文件建立 DataFrame ~ 按列 从剪贴板创建 DataFrame 把 DataFrame 分割为两个随机子集 根据多个类别筛选 DataFrame 根据最大的类别筛选 DataFrame...注意:如果索引值有重复、不唯一,这种方式会失效。 13. 根据多个类别筛选 DataFrame 预览 movies。 ? 查看 genre(电影类型)列。 ?...用 dropna() 删除列里的所有缺失值。 ? 只想删除列中缺失值高于 10% 的缺失值,可以设置 dropna() 里的阈值,即 threshold. ? 16....年龄列有 1 位小数,票价列有 4 位小数,如何将这两列显示的小数位数标准化? 用以下代码让这两列只显示 2 位小数。 ? 第一个参数是要设置的选项名称,第二个参数是 Python 的字符串格式。...设置 DataFrame 样式 上面的技巧适用于调整整个 Jupyter Notebook 的显示内容。 不过,要想为某个 DataFrame 设定指定的样式,pandas 还提供了更灵活的方式。

    8.2K20

    【如何在 Pandas DataFrame 中插入一列】

    然而,对于新手来说,在DataFrame中插入一列可能是一个令人困惑的问题。在本文中,我们将分享如何解决这个问题的方法,并帮助读者更好地利用Pandas进行数据处理。...解决在DataFrame中插入一列的问题是学习和使用Pandas的必要步骤,也是提高数据处理和分析能力的关键所在。 在 Pandas DataFrame 中插入一个新列。...第一列是 0。 **column:赋予新列的名称。 value:**新列的值数组。 **allow_duplicates:**是否允许新列名匹配现有列名。默认值为假。...不同的插入方法: 在Pandas中,插入列并不仅仅是简单地将数据赋值给一个新列。...总结: 在Pandas DataFrame中插入一列是数据处理和分析的重要操作之一。通过本文的介绍,我们学会了使用Pandas库在DataFrame中插入新的列。

    3.9K10

    Pandas 25 式

    ~ 按行 用多个文件建立 DataFrame ~ 按列 从剪贴板创建 DataFrame 把 DataFrame 分割为两个随机子集 根据多个类别筛选 DataFrame 根据最大的类别筛选 DataFrame...注意:如果索引值有重复、不唯一,这种方式会失效。 13. 根据多个类别筛选 DataFrame 预览 movies。 ? 查看 genre(电影类型)列。 ?...用 dropna() 删除列里的所有缺失值。 ? 只想删除列中缺失值高于 10% 的缺失值,可以设置 dropna() 里的阈值,即 threshold. ? 16....年龄列有 1 位小数,票价列有 4 位小数,如何将这两列显示的小数位数标准化? 用以下代码让这两列只显示 2 位小数。 ? 第一个参数是要设置的选项名称,第二个参数是 Python 的字符串格式。...设置 DataFrame 样式 上面的技巧适用于调整整个 Jupyter Notebook 的显示内容。 不过,要想为某个 DataFrame 设定指定的样式,pandas 还提供了更灵活的方式。

    9.5K00

    python数据分析——数据预处理

    在数据分析的过程中,对异常值的处理通常包括以下3种方法: 最常用的方式是删除。 将异常值当缺失值处理,以某个值填充。 将异常值当特殊情况进行分析,研究异常值出现的原因。...可以是单个列名的字符串,也可以是列名列表。 drop:指示是否在新索引中保留原有的列。默认为True,表示将原有的列从DataFrame中删除。 append:指示是否将新的索引添加到原有的索引之后。...然后,使用set_index()函数将列’A’作为新的索引。最后,使用set_index()函数将列’A’和列’B’一起作为新的索引,并将新的索引添加到原有的索引之后。...如果某个索引值在原对象中不存在,reindex()会为该索引值插入缺失值(NaN或None)。...=0) 以上示例分别演示了如何重新索引行、列以及如何填充缺失值。

    2.1K10

    利用NumPy和Pandas进行机器学习数据处理与分析

    本篇博客将介绍Pandas的基本语法,以及如何利用Pandas进行数据处理,从而为机器学习任务打下坚实的基础。什么是Series?Series是pandas中的一维标记数组。...每个值都有一个与之关联的索引,它们以0为起始。Series的数据类型由pandas自动推断得出。什么是DataFrame?...DataFrame是pandas中的二维表格数据结构,类似于Excel中的工作表或数据库中的表。它由行和列组成,每列可以有不同的数据类型。...字典的键表示列名,对应的值是列表类型,表示该列的数据。我们可以看到DataFrame具有清晰的表格结构,并且每个列都有相应的标签,方便阅读访问和筛选数据我们可以使用索引、标签或条件来访问和筛选数据。...例如,要添加一列数据,可以将一个新的Series赋值给DataFrame的一个新列名# 添加列df['Gender'] = ['Male', 'Female', 'Male', 'Female']print

    72220

    手撕Python三大packages,看了他直接成为数模战神!

    3 的元素之前(不包括第四个元素),将这部分元素组成一个新的子数组赋值给sub_arr变量,最后打印这个子数组。...然后将这个布尔值 Series 作为索引,从data这个DataFrame中筛选出对应True的行,组成新的DataFrame对象filtered_data并打印。...() data.dropna()会返回一个新的DataFrame,其中所有包含缺失值的行都被删除了,然后将这个新的DataFrame重新赋值给data变量。...0)会将data中所有的缺失值替换为 0,生成一个新的DataFrame并重新赋值给data。...['column_name']这一列的字符串数据转换为数值类型,如果转换成功,会返回一个新的数值类型的 Series,然后将其重新赋值给data['column_name'],从而更新了data中这一列的数据类型

    22910
    领券