标签:Excel公式,SUMPRODUCT函数 基于列中的条件求和通常使用SUMIF函数或者SUMIFS函数,特别是涉及到多条件求和时。然而,随着条件的增多,公式将会变得很长,难以理解。...而使用SUMPRODUCT函数,可以判断同一列中的多个条件且公式简洁。 如下图1所示的示例。...*($C$2:$C$12)) 公式中,使用加号(+)来连接条件,表明满足这两个条件之一。...也可以使用下面更简洁的公式: =SUMPRODUCT(($A$2:$A$12="东区")*(($B$2:$B$12={"超市1","超市2"}))*($C$2:$C$12)) 公式中,使用了花括号,允许在其中放置多个条件...,因此,如果需要满足的条件更多的话,就可以通过逗号分隔符将它们放置在花括号中,公式更简洁。
在实际工作中,我们经常需要从某列返回数据,该数据对应于另一列满足一个或多个条件的数据中的最大值。 如下图1所示,需要返回指定序号(列A)的最新版本(列B)对应的日期(列C)。 ?...原因是与条件对应的最大值不是在B2:B10中,而是针对不同的序号。而且,如果该情况发生在希望返回的值之前行中,则MATCH函数显然不会返回我们想要的值。...B10,0)) 转换为: =INDEX(C2:C10,MATCH(4,B2:B10,0)) 转换为: =INDEX(C2:C10,MATCH(4,{4;2;5;3;1;3;4;1;2},0)) 很显示,数组中的第一个满足条件的值并不是我们想要查找的值所在的位置...: =INDEX(C2:C10,1) 得到: 2013-2-21 这并不是满足我们的条件对应的值。...由于数组中的最小值为0.2,在数组中的第7个位置,因此上述公式构造的结果为: {0;0;0;0;0;0;1;0;0;0} 获得此数组后,我们只需要从列C中与该数组出现的非零条目(即1)相对应的位置返回数据即可
标签:pandas idxmax()方法可以使一些操作变得非常简单。例如,基于条件获取数据框架中的第一行。本文介绍如何使用idxmax方法。...什么是pandasidxmax idxmax()方法返回轴上最大值第一次出现的索引。 例如,有4名ID为0,1,2,3的学生的测试分数,由数据框架索引表示。...这里很有趣:学生3的Math和CS都是满分(100),然而idxmax()仅返回Math,即第一次出现对应的值。...图3 基于条件在数据框架中获取第一行 现在我们知道了,idxmax返回数据框架最大值第一次出现的索引。那么,我们可以使用此功能根据特定条件帮助查找数据框架中的第一行。...例如,假设有SPY股票连续6天的股价,我们希望找到在股价超过400美元时的第一行/日期。 图4 让我们按步骤进行分解,首先对价格进行“筛选”,检查价格是否大于400。此操作的结果是布尔索引。
当条件满足且为True时,将返回第二个参数,否则返回第三个参数。 看下面的例子: numpy.where()它从我们的条件中创建一个布尔数组,并在条件为真或假时返回两个参数,它对每个元素都这样做。...这对于在Dataframe中创建新列非常有用。 比apply函数快344倍! 如果我们在Series添加了.values ,它的作用是返回一个NumPy数组,里面是我的级数中的数据。...现在的numpy.where(),只查看数组中的原始数据,而不必负责Pandas Series带来的内容,如index或其他属性。这个小的变化通常会在时间上产生巨大的差异。 各位!...向量化选项将在0.1秒多一点的时间内返回列,.apply()将花费12.5秒。嵌套的np.where()解决方案工具179ms。 那么嵌套的多个条件,我们可以向量化吗?可以!...根据经验,你需要为每个return语句设置n个条件,这样就可以将所有布尔数组打包到一个条件中,以返回一个选项。
与Excel中的筛选类似,我们还可以在数据框架上应用筛选,唯一的区别是Python pandas中的筛选功能更强大、效率更高。...图2 发生了什么(原理) 了解事情究竟是怎么发生的很重要,这将帮助我们理解如何在pandas上使用筛选。...我们传递给loc[]的条件:df['总部所在国家'] == '中国',实际上是一个布尔索引,它是一个True值或False值列表。...当你将这个布尔索引传递到df.loc[]中时,它将只返回有真值的行(即,从Excel筛选中选择1),值为False的行将被删除。...在现实生活中,我们经常需要根据多个条件进行筛选,接下来,我们将介绍如何在pandas中进行一些高级筛选。
2. pandas的数据结构DataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔值的)。...dataframe中的数据是以一个或者多个二位块存放的(而不是列表、字典或者别的一维数据结构)。 3.索引对象 pandas的索引对象负责管理轴标签和其他元素(比如轴名称等)。...函数应用和映射 NumPy的ufuncs(元素级数组方法)也可用操作pandas对象 DataFrame中将函数应用到由各列或各行所行成的一维数组上可用apply方法。 7....9.2 NA处理办法 dropna 根据各标签值中是否存在缺失数据对轴标签进行过滤,可通过阀值调节对缺失值的容忍度 fillna 用指定的或插值方法(如ffil或bfill...)填充缺失数据 isnull 返回一个含有布尔值的对象,这些布尔值表示哪些值是缺失值/NA,该对象的类型与源类型一样 notnull isnull的否定式 10.
这种进行比较的代码,返回值是布尔值,是一种布尔表达式,也可以被称为逻辑语句,只要代码返回的结果是布尔值,都可以把代码当成逻辑语句。 ?...除了直接的比较,Pandas中有很多函数都会返回布尔值,如all(),any(),isna()等对整个DataFrame或Series的判断结果,eq(),ne(),lt(),gt()等比较函数的结果,...逻辑语句是为逻辑运算服务的,可以直接作为判断条件。在复杂的逻辑关系中,需要使用复合逻辑运算,用逻辑运算符来连接多个逻辑语句,复合逻辑运算包含:逻辑与、逻辑或、逻辑非。 2. 逻辑与 ?...(and和or可以不计算出右边表达式的布尔值就做出判断,也可以将其中一个表达式作为返回值。另外,Python可以将其他值作为布尔判断条件,如非空字符串表示真。)...在查询字符串中,进行条件判断不是用列来判断,而是直接用列索引来判断。当多个条件并列时,因为逻辑运算符的优先级高于比较运算符的优先级,每一个逻辑语句的括号也可以省略。
五、布尔索引 在本章中,我们将介绍以下主题: 计算布尔统计量 构造多个布尔条件 使用布尔索引进行过滤 使用索引选择来替代布尔索引 使用唯一索引和排序索引进行选择 了解股票价格 翻译 SQL WHERE子句...这些布尔值通常存储在序列或 NumPy ndarray中,通常是通过将布尔条件应用于数据帧中的一个或多个列来创建的。...基础”的“将序列方法链接到一起”秘籍 参阅第 1 章,“Pandas 基础”中的“使用运算符”秘籍 构造多个布尔条件 在 Python 中,布尔表达式使用内置的逻辑运算符and,or和not。...更多 布尔选择比索引选择具有更大的灵活性,因为可以对任意数量的列进行条件调整。 在此秘籍中,我们使用单列作为索引。 可以将多个列连接在一起以形成索引。...mask方法的第一个参数是条件,该条件通常是布尔级数,例如criteria。 因为mask方法是从数据帧调用的,所以条件为False的每一行中的所有值都将变为丢失。
pandas中的SUMIF 使用布尔索引 要查找Manhattan区的电话总数。布尔索引是pandas中非常常见的技术。本质上,它对数据框架应用筛选,只选择符合条件的记录。...在df[]中,这个表达式df['Borough']=='MANHATTAN'返回一个完整的True值或False值列表(2440个条目),因此命名为“布尔索引”。...一旦将这个布尔索引传递到df[]中,只有具有True值的记录才会返回。这就是上图2中获得1076个条目的原因。...Pandas中的SUMIFS SUMIFS是另一个在Excel中经常使用的函数,允许在执行求和计算时使用多个条件。 这一次,将通过组合Borough和Location列来精确定位搜索。...图6 与只传递1个条件Borough==‘Manhattan’的SUMIF示例类似,在SUMIFS中,传递多个条件(根据需要)。在这个示例中,只需要两个。
- Pandas 是基于 NumPy 数组构建的,特别是基于数组的函数和不使用 for 循环的数据处理。...(如根据布尔型数组进行过滤、标量乘法、应用数学函数等)都会保留索引值的链接: import pandas as pd obj2 = pd.Series([5,2,-3,1], index=['d',...下表对DataFrame进行了总结: 类型 描述 df[val] 从DataFrame选取单列或一组列;在特殊情况下比较便利:布尔型数组(过滤行)、切片(行切片)、或布尔型DataFrame(根据条件设置值...,你可能希望根据一个或多个列中的值进行排序。...计算Series中的唯一值数组,按发现的顺序返回 value_counts 返回一个Series,其索引为唯一值,其值为频率,按计数值降序排列 有时,你可能希望得到DataFrame中多个相关列的一张柱状图
应用场景 NumPy在科学计算和数据分析中有广泛应用,例如: 数据分析:pandas库就是基于NumPy构建的,用于数据清洗、统计和展示。...通过这些基础知识和资源,初学者可以逐步掌握NumPy,并应用于实际的科学计算和数据分析任务中。 NumPy中有哪些高级数学函数和统计函数?...在NumPy中,提供了丰富的高级数学函数和统计函数,这些函数可以用于各种数据分析和科学计算。以下是一些主要的高级数学和统计函数: 高级数学函数 线性代数: 方阵的迹:计算方阵对角线元素之和。...处理NaN值的函数:如nanmax()、nanmin()等,用于处理包含NaN值的数组操作。 如何在NumPy中实现矩阵分解算法?...以下是一些最佳实践,帮助你更好地集成和使用这两个库: 理解NumPy和Pandas的关系: Pandas是基于NumPy构建的,因此大部分Pandas操作都依赖于NumPy进行数值计算。
大量使用列表,将无可避免的使用循环。 当大家对numpy足够熟悉的时候,我建议大家这样做: 将python循环和条件逻辑转换为数组运算和布尔数组运算。 尽量使用广播。...与其他科学计算环境相反(R或matlab),numpy允许更为灵活地控制数据在内存中的布局。具体来说,比如展开数组时是按列优先还是按行优先。...pandas的操作对象主要是结构化数据,numpy的操作对象主要是ndarray数组。这两者之间有很多功能函数是一一对应的,比如,pandas有对表格的拼接,ndarray也有对数组的拼接。...image.png 有拼接就有拆分,split函数用于将一个数组沿指定轴拆分为多个数组。...image.png 当然,不幸的是,这种创造ufunc的手段虽然很灵活,却非常慢。因为它们在计算的时候都要执行一次python函数调用,这自然会比numpy自带的基于C编写的ufunc慢很多。
NumPy主要数据类型:浮点型、复数、整数、布尔值、字符串还有普通的Python对象。 7. 数组和标量之间的计算:数组可以代替循环对数据执行批量操作。...切片:跟列表最重要的区别在于,数组切片是原始数组的视图。 10. 切片索引:切片是沿着一个轴向选取元素的,可以一次传入多个切片,就像传入多个索引那样。 11....对于高维数组,transpose需要得到一个由轴编号组成的元组才能对这些轴进行转置。 13. 通用函数:快速的元素级数组函数。...顶级方法np.sort返回的是数组的已排序副本,而就地排序则会修改数组本身。 17....用数组的文件进行输入输出 将数组以二进制格式保存到磁盘:np.save和np.load 存取文本文件:pandas中的read_csv和read_table函数;np.loadtxt或np.genfromtxt
布尔索引 布尔索引用于基于条件来选择数组中的元素。这对于筛选满足特定条件的元素非常有用。...,切片操作可以同时作用于多个维度。...NumPy允许我们根据条件筛选数组中的元素,并且可以直接对这些筛选出来的元素进行赋值操作。...NumPy与其他Python库的集成 NumPy通常与其他科学计算和数据分析库一起使用,如Pandas、Matplotlib等。它为这些库提供了高效的数组操作支持。...NumPy与Pandas Pandas是基于NumPy构建的高级数据分析库。Pandas的DataFrame和Series对象在底层都是由NumPy数组支持的。
布尔型索引选取数组中的数据,将总是创建数据的副本,即使返回一模一样的数组也是如此。 花式索引 花式索引(Fancy indexing)是一个NumPy术语,它指的是利用整数数组进行索引。...) 快速的元素级数组函数 通用函数(即ufunc)是一种对ndarray中的数据执行元素级运算的函数。...sum经常被用来对布尔型数组中的True值计数: (arr > 0).sum() arrs.any() 测试数组中是否存在一个或多个True arrs.all() 检查数组中所有值是否都是...np.unique :返回数组中的唯一值以及已排序的结果 np.in1d :测试一个数组中的值在另一个数组中的成员资格(是否存在),返回一个布尔型数组 常用集合函数 用于数组的文件输入输出...伪随机数,是因为它们都是通过算法基于随机数生成器种子,在确定性的条件下生成的。
Pandas是什么? Pandas是数据分析的核心工具包,基于Numpy创建,为数据分析而存在。...np.random.rand(5), index = ['a','b','c','d','e']) print(s) print(s['a'],type(s['a']),s['a'].dtype) # 如果需要选择多个标签的值...# 布尔型索引 # 数组做判断之后,返回的是一个由布尔值组成的新的数组 # .isnull() / .notnull() 判断是否为空值 (None代表空值,NaN代表有问题的数值,两个都会识别为空值...) # 布尔型索引方法:用[判断条件]表示,其中判断条件可以是 一个语句,或者是 一个布尔型数组!...创建一个Series,包含10个元素,且每个值为0-100的均匀分布随机值,index为a-j,请分别筛选出: 标签为b,c的值为多少 Series中第4到6个值是哪些?
中,以及一个实际应用多个DataFrame的实战项目例子。...Pandas是基于Numpy(Numpy基于Python)基础开发,因此能和带有第三方库的科学计算环境很好地进行集成。...data,如NaN, non-floating数据。...isnull 返回一个含有布尔的对象,这些布尔表示哪些是缺失 notnull isnull 的否定式 dropna 根据各标签中是否存在缺失数据对轴标签进行过滤,返回不为NaN...调用pd_data.isnull(),返回所有元素是否为null的布尔结果: ?
此外,pandas 还提供了一些更具领域特定功能,如时间序列操作,这在 NumPy 中不存在。...&(和)和|(或)选择三个名称中的两个来组合多个布尔条件: In [113]: mask = (names == "Bob") | (names == "Will") In [114]: mask Out...虽然不常见,ufunc 可以返回多个数组。...注意 虽然 DataFrame 在物理上是二维的,但您可以使用它来以分层索引的方式表示更高维度的数据,这是我们将在第八章:数据整理:连接、合并和重塑中讨论的一个主题,并且是 pandas 中一些更高级数据处理功能的一个组成部分...如果您已经有一个不包含这些条目的索引数组或列表,那么从轴中删除一个或多个条目就很简单,因为您可以使用reindex方法或基于.loc的索引。
# Pandas 库 # 为什么要学习pandas 那么问题来了: numpy已经能够帮助我们处理数据,能够结合matplotlib解决我们数据分析的问题,那么pandas学习的目的在什么地方呢?...numpy能够帮我们处理处理数值型数据,但是这还不够, 很多时候,我们的数据除了数值之外,还有字符串,还有时间序列等 比如:我们通过爬虫获取到了存储在数据库中的数据 所以,pandas出现了。...{#什么是pandas} Pandas的名称来自于面板数据(panel data) Pandas是一个强大的分析结构化数据的工具集,基于NumPy构建,提供了高级数据结构和数据操作工具,它是使Python...//pandas.pydata.org/ (opens new window) # Pandas的数据结构 import pandas as pd Pandas有两个最主要也是最重要的数据结构:Series...类似多维数组/表格数据(如,excel,R中的data.frame) 每列数据可以是不同的类型 索引包括列索引和行索引 # DataFrame构建
矩阵:没有行名和列名 numpy 矩阵:推荐只存放一种数据类型的数据,但可允许多种数据类型 2.1 新建矩阵 使用numpy模块中的array()函数 2.2 取子集 使用下标和切片法: 2.3 矩阵和数据转换...中的DataFrame()函数 可以使用index参数指定行名 方式2:从csv文件读取 import pandas as pd df2 = pd.read_csv("day3_preview/gene.csv...series df1.gene.tolist() # series 转为list df1[['gene']] # 返回数据框 提取多列:在方括号里面写有列名组成的列表 3.3 提取行和列 .iloc:...基于整数位置 loc:基于标签(行名或者列名)或是布尔值 import pandas as pd df1 = pd.DataFrame({ 'gene': ['gene' + str(i) for...:使用多个条件时,可以用and/or/&/|运算符 3.4 属性 写法与method类型,不带括号 df1.shape df1.index # 行名 df1.columns # 列名 3.5 初级统计方法
领取专属 10元无门槛券
手把手带您无忧上云