首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Excel与pandas:使用applymap()创建复杂的计算列

标签:Python与Excel,pandas 我们之前讨论了如何在pandas中创建计算列,并讲解了一些简单的示例。...通过将表达式赋值给一个新列(例如df['new column']=expression),可以在大多数情况下轻松创建计算列。然而,有时我们需要创建相当复杂的计算列,这就是本文要讲解的内容。...图1 创建一个辅助函数 现在,让我们创建一个取平均值的函数,并将其处理/转换为字母等级。 图2 现在我们要把这个函数应用到每个学生身上。那么,在列中对每个学生进行循环?不!...pandas applymap()方法 pandas提供了一种将自定义函数应用于列或整个数据框架的简单方法,就是.applymap()方法,这有点类似于map()函数的作用。...注意下面的代码,我们只在包含平均值的三列上应用函数。因为我们知道第一列包含字符串,如果我们尝试对字符串数据应用letter_grade()函数,可能会遇到错误。

3.9K10
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    select count(*)、count(1)、count(主键列)和count(包含空值的列)有何区别?

    下班路上看见网上有人问一个问题: oracle 10g以后count(*)和count(非空列)性能方面有什么区别?...首先,准备测试数据,11g库表bisal的id1列是主键(确保id1列为非空),id2列包含空值, ?...前三个均为表数据总量,第四个SQL结果是99999,仅包含非空记录数据量,说明若使用count(允许空值的列),则统计的是非空记录的总数,空值记录不会统计,这可能和业务上的用意不同。...其实这无论id2是否包含空值,使用count(id2)均会使用全表扫描,因此即使语义上使用count(id2)和前三个SQL一致,这种执行计划的效率也是最低的,这张测试表的字段设置和数据量不很夸张,因此不很明显...总结: 11g下,通过实验结论,说明了count()、count(1)和count(主键索引字段)其实都是执行的count(),而且会选择索引的FFS扫描方式,count(包含空值的列)这种方式一方面会使用全表扫描

    3.4K30

    Pandas库的基础使用系列---获取行和列

    前言我们上篇文章简单的介绍了如何获取行和列的数据,今天我们一起来看看两个如何结合起来用。获取指定行和指定列的数据我们依然使用之前的数据。...我们试试看如何将最后一列也包含进来。info = df.iloc[:, [1, 4, -1]]可以看到也获取到了,但是值得注意的是,如果我们使用了-1,那么就不能用loc而是要用iloc。...接下来我们再看看获取指定行指定列的数据df.loc[2, "2022年"]是不是很简单,大家要注意的是,这里的2并不算是所以哦,而是行名称,只不过是用了padnas自动帮我创建的行名称。...通常是建议这样获取的,因为从代码的可读性上更容易知道我们获取的是哪一行哪一列。当然我们也可以通过索引和切片的方式获取,只是可读性上没有这么好。...df.iloc[[2,5], :4]如果不看结果,只从代码上看是很难知道我们获取的是哪几列的数据。结尾今天的内容就是这些,下篇内容会和大家介绍一些和我们这两篇内容相关的一些小技巧或者说小练习敬请期待。

    63700

    pandas中的loc和iloc_pandas获取指定数据的行和列

    大家好,又见面了,我是你们的朋友全栈君 实际操作中我们经常需要寻找数据的某行或者某列,这里介绍我在使用Pandas时用到的两种方法:iloc和loc。...读取第二行的值 (2)读取第二行的值 (3)同时读取某行某列 (4)进行切片操作 ---- loc:通过行、列的名称或标签来索引 iloc:通过行、列的索引位置来寻找数据 首先,我们先创建一个...Dataframe,生成数据,用于下面的演示 import pandas as pd import numpy as np # 生成DataFrame data = pd.DataFrame(np.arange...[1,:] (2)读取第二列的值 # 读取第二列全部值 data2 = data.loc[ : ,"B"] 结果: (3)同时读取某行某列 # 读取第1行,第B列对应的值 data3...和columns进行切片操作 # 读取第2、3行,第3、4列 data1 = data.iloc[1:3, 2:4] 结果: 注意: 这里的区间是左闭右开,data.iloc[1:

    10K21

    盘点一个Pandas提取Excel列包含特定关键词的行(下篇)

    一、前言 前几天在Python白银交流群【上海新年人】问了一个Pandas数据提取的问题,上一篇中已经给出了代码,粉丝自己可能还没有领悟明白,一用就废,遇到了问题。...他的代码照片如下图: 这个代码这么写,最后压根儿就没有得到他自己预期的结果,遂来求助。这里又回归到了他自己最开始的需求澄清!!!论需求表达清晰的重要性!...后来【莫生气】修改后的代码如下所示: # 创建布尔Series mask = df['作者'].isin(['留言0117', '留0117言', '0117留言', '留言0117']) # 使用布尔...能给你做出来,先实现就不错了,再想着优化的事呗。 后来【莫生气】给了一个正则表达式的写法,总算是贴合了这个粉丝的需求。 如果要结合pandas的话,可以写为下图的代码: 至此,粉丝不再修改需求。...这篇文章主要盘点了一个Pandas数据提取的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。 最后感谢粉丝【上海新年人】提出的问题,感谢【鶏啊鶏。】

    32810

    盘点一个Pandas提取Excel列包含特定关键词的行(上篇)

    一、前言 前几天在Python白银交流群【上海新年人】问了一个Pandas数据提取的问题,问题如下:大佬们,请教个小问题,我要查找某列中具体的值,譬如df[df['作者'] == 'abc'],但实际上这样子我找不到...ABC,因为对方实际是小写的abc。...再次反应是加个或进行处理,也可以用如下代码: # 创建布尔Series mask = df['作者'].isin(['ABC', 'abc']) # 使用布尔Series来索引DataFrame result...但是粉丝的需求又发生了改变,下一篇文章我们一起来看看这个“善变”的粉丝提问。 三、总结 大家好,我是皮皮。...这篇文章主要盘点了一个Pandas数据提取的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。

    32210

    盘点一个Pandas提取Excel列包含特定关键词的行(中篇)

    一、前言 前几天在Python白银交流群【上海新年人】问了一个Pandas数据提取的问题,但是粉丝又改需求了,需求改来改去的,就是没个定数。 这里他的最新需求,如上图所示。...他的意思在这里就是要上图中最下面这3个。 二、实现过程 后来【论草莓如何成为冻干莓】给了一份代码,如下图所示: 顺利地解决了粉丝的问题。...可以看到,代码刚给出来,但是粉丝的需求又发生了改变,不过不慌,这里又给出了对应代码,如下图所示: 一看就会,一用就废,粉丝自己刚上手,套用到自己的数据里边,代码就失灵了。...下一篇文章,我们再来看这位粉丝新遇到的问题。 三、总结 大家好,我是皮皮。这篇文章主要盘点了一个Pandas数据提取的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。...最后感谢粉丝【上海新年人】提出的问题,感谢【鶏啊鶏。】、【论草莓如何成为冻干莓】给出的思路,感谢【莫生气】等人参与学习交流。

    21710

    用过Excel,就会获取pandas数据框架中的值、行和列

    标签:python与Excel,pandas 至此,我们已经学习了使用Python pandas来输入/输出(即读取和保存文件)数据,现在,我们转向更深入的部分。...在Python中,数据存储在计算机内存中(即,用户不能直接看到),幸运的是pandas库提供了获取值、行和列的简单方法。 先准备一个数据框架,这样我们就有一些要处理的东西了。...df.columns 提供列(标题)名称的列表。 df.shape 显示数据框架的维度,在本例中为4行5列。 图3 使用pandas获取列 有几种方法可以在pandas中获取列。...每种方法都有其优点和缺点,因此应根据具体情况使用不同的方法。 点符号 可以键入“df.国家”以获得“国家”列,这是一种快速而简单的获取列的方法。但是,如果列名包含空格,那么这种方法行不通。...在pandas中,这类似于如何索引/切片Python列表。 要获取前三行,可以执行以下操作: 图8 使用pandas获取单元格值 要获取单个单元格值,我们需要使用行和列的交集。

    19.2K60

    如何在 Pandas 中创建一个空的数据帧并向其附加行和列?

    Pandas是一个用于数据操作和分析的Python库。它建立在 numpy 库之上,提供数据帧的有效实现。数据帧是一种二维数据结构。在数据帧中,数据以表格形式在行和列中对齐。...在本教程中,我们将学习如何创建一个空数据帧,以及如何在 Pandas 中向其追加行和列。...语法 要创建一个空的数据帧并向其追加行和列,您需要遵循以下语法 - # syntax for creating an empty dataframe df = pd.DataFrame() # syntax...Pandas.Series 方法可用于从列表创建系列。列值也可以作为列表传递,而无需使用 Series 方法。 例 1 在此示例中,我们创建了一个空数据帧。...Pandas 库创建一个空数据帧以及如何向其追加行和列。

    28030

    Python~Pandas 小白避坑之常用笔记

    Python~Pandas 小白避坑之常用笔记 ---- 提示:该文章仅适合小白同学,如有错误的地方欢迎大佬在评论处赐教 ---- 前言 1、Pandas是python的一个数据分析包,为解决数据分析任务而创建的...对象进行异常值剔除、修改 需求:“Age”列存在数值为-1、0 和“-”的异常值,删除存在该情况的行数据;“Age”列存在空格和“岁”等异常字符,删除这些异常字符但须保留年龄数值 import pandas...# sheet1['年度'] = sheet1['日期'].dt.year # 根据日期字段 新增年份列 # sheet1['季度'] = sheet1['日期'].dt.quarter # 根据日期字段...dt.year # 根据日期字段 新增年份列 sheet1['季度'] = sheet1['日期'].dt.quarter # 根据日期字段 新增季度列 # 按年度分组,指定销售额列进行求和计算 compute_result...'].dt.year # 根据日期字段 新增年份列 sheet1['季度'] = sheet1['日期'].dt.quarter # 根据日期字段 新增季度列 # 针对字段:年度、国家进行分组,求和计算字段

    3.1K30

    大数据分析工具Power BI(六):DAX表达式简单运用

    DAX 包含一些在 Excel 公式中使用的函数,此外还包含其他设计用于处理关系数据和执行动态聚合的函数。...','第四季度点播订单表') 图片 五、创建日期表 在Power BI中我们经常使用时间函数来对包含日期列的数据表进行时间转换操作做进一步的分析,这里我们通过Power BI创建一张日期表来演示日期函数的操作使用...1、通过CALENDAR函数创建日期表 创建日期表可以使用CALENDAR函数来实现,其用法如下: CALENDAR(StartDate,EndData) CALENDAR函数可以通过指定一个开始日期和结束日期生成一列顺序的日期数据表..."新建列"根据当前列通过DAX函数来抽取日期列的年、月、日等信息,操作如下,新建列并指定DAX表达式为:年份 = YEAR(DATE) 图片 按照以上方式我们多次创建列并输入DAX表达式:月份 = MONTH...需求:创建一张时间表,包含年份、月份、日期、季度、星期、年份季度、年月、年周、全日期列字段,具体操作如下,新建表,输入DAX公式如下: 日期表2 = ADDCOLUMNS( CALENDAR(DATE

    4.1K101

    在数据框架中创建计算列

    图1 在pandas中创建计算列的关键 如果有Excel和VBA的使用背景,那么一定很想遍历列中所有内容,这意味着我们在一个单元格中创建公式,然后向下拖动。然而,这不是Python的工作方式。...panda数据框架中的字符串操作 让我们看看下面的示例,从公司名称列中拆分中文和英文名称。df[‘公司名称’]是一个pandas系列,有点像Excel或Power Query中的列。...首先,我们需要知道该列中存储的数据类型,这可以通过检查列中的第一项来找到答案。 图4 很明显,该列包含的是字符串数据。 将该列转换为datetime对象,这是Python中日期和时间的标准数据类型。...我们将导入datetime库来处理日期和时间。...df['成立年份'] = df['成立时间'].str.split("-",expand=True)[0] 无需检查数据类型,我们知道这个新创建的列包含字符串数据,因为.split()方法将返回一个字符串

    3.8K20

    初学者使用Pandas的特征工程

    问题是:在给定某些变量的情况下,要预测在不同城市的不同商店中存在的产品的销售情况。问题中包含的数据大多与商店和产品有关。...我们已经成功地使用了lambda函数apply创建了一个新的分类变量。 用于频率编码的value_counts() 和apply() 如果名义分类变量中包含许多类别,则不建议使用独热编码。...12-07-2020 01:00:45,看看这个日期,想想这个特定日期的所有可能组成部分。乍一看,我们可以知道我们有一天,月份,年份,小时,分钟和秒。...但是,如果你强调日期,则会发现你还可以计算一周中的某天,一年中的某个季度,一年中的某周,一年中的某天等等。我们可以通过这一日期时间变量创建的新变量的数量没有限制。...它取决于问题陈述和日期时间变量(每天,每周或每月的数据)的频率来决定要创建的新变量。 尾注 那就是pandas的力量;仅用几行代码,我们就创建了不同类型的新变量,可以将模型的性能提升到另一个层次。

    4.9K31

    精选100个Pandas函数

    精选100个Pandas函数 精心整理100个pandas常用函数,建议收藏~ a aggregate() #聚合;基于内置函数或者自定义函数的聚合运算 argmin() 最小值所在的索引 argmax...dt.time() 提取时间 dt.year() 提取年份 dt.month() 提取年份 dt.day() 提取天/日 dt.hour() 提取小时 dt.minute()...() 是否为当月的第一天 dt.is_month_end() 是否为当月的最后裔天 dt.is_quarter_start() 是否为季度的第一天 dt.is_quarter_end() 是否为季度的最后一天...n个值 nlargest() 最大的前n个值 p pct_change 运算比率;后一个和前一个的比例 pd.to_datetime() 转日期时间类型 pd.Series() # 创建Series...数据 pd.DataFrame() # 创建DataFrame数据 plot() 绘制基于Kind参数的多种图形;kind指定图形类型:饼图、柱状图、箱型图等 q quantile() 分位数 r

    27530

    3 个不常见但非常实用的Pandas 使用技巧

    来源:DeepHub IMBA本文共1000字,建议阅读5分钟本文为你演示一些不常见,但是却非常有用的 Pandas 函数。 创建一个示例 DataFrame 。...date 列包含 100 个连续日期,class 列包含 4 个以对象数据类型存储的不同值,amount 列包含 10 到 100 之间的随机整数。 1....To_period 在 Pandas 中,操作 to_period 函数允许将日期转换为特定的时间间隔。使用该方法可以获取具有许多不同间隔或周期的日期,例如日、周、月、季度等。...但是我们通过使用to_period 函数的参数”M“实现时间序列。 让我们为年月和季度创建新列。...Cumsum 和 groupby cumsum 是一个非常有用的 Pandas 函数。它计算列中值的累积和。

    1.3K10

    3 个不常见但非常实用的Pandas 使用技巧

    在本文中,将演示一些不常见,但是却非常有用的 Pandas 函数。 创建一个示例 DataFrame 。...date 列包含 100 个连续日期,class 列包含 4 个以对象数据类型存储的不同值,amount 列包含 10 到 100 之间的随机整数。...1、To_period 在 Pandas 中,操 to_period 函数允许将日期转换为特定的时间间隔。使用该方法可以获取具有许多不同间隔或周期的日期,例如日、周、月、季度等。...但是我们通过使用to_period 函数的参数”M“实现时间序列。 让我们为年月和季度创建新列。...但是它只是全部的总和没有考虑分类。在某些情况下,我们可能需要分别计算不同类别的累积和。 Pandas中我们只需要按类列对行进行分组,然后应用 cumsum 函数。

    1.8K30

    Python时间序列分析苹果股票数据:分解、平稳性检验、滤波器、滑动窗口平滑、移动平均、可视化

    创建瞬时 日期、日期时间和时间都是单独的类,我们可以通过多种方式创建它们,包括直接创建和通过字符串解析。...两个日期、datetimes 或 times 之间的最小差值 日期/日期时间 object.year 返回年份 object.month 返回月份(1 - 12) object.day 返回日期(...属性 描述 Series.dt.date 返回包含Python datetime.date对象的numpy数组(即,没有时区信息的时间戳的日期部分)。...pandas.date_range 是一个函数,允许我们创建一系列均匀间隔的日期。...SMS 半月初频率(每月1日和15日) BMS 工作日月初频率 CBMS 定制的工作日月初频率 Q 季末频率 BQ 工作日季末频率 QS 季初频率 BQS 工作日季初频率 A, Y 年末频率 BA,

    67400

    Pandas 学习手册中文第二版:11~15

    ,此结果包含重复的列。...为了说明这一点,下面的代码创建一个DataFrame,其中Label列带有两个值(A和B),以及一个Values列,其中包含整数序列,但其中一个值替换为NaN。...此图中的次要标签包含当月的日期,而主要标签则包含年和月(仅第一个月的年份)。 我们可以为每个次要和主要级别设置定位器和格式化器,以更改值。...这将通过将次要标签更改为从每周的星期一开始并包含日期和星期几来演示(现在,图表使用每周,并且仅使用星期五的日期,没有日期名称)。...但是,请注意,该年份报告为0045。 要使用基于自定义日期的标签创建图,需要避开 Pandas .plot()并直接使用matplotlib。 幸运的是,这并不难。

    3.4K20
    领券