首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

通宵翻译Pandas官方文档,写了这份Excel万字肝货操作!

列操作 在电子表格中,公式通常在单个单元格中创建,然后拖入其他单元格以计算其他列的公式。在 Pandas 中,您可以直接对整列进行操作。...pandas 通过在 DataFrame 中指定单个系列来提供矢量化操作。可以以相同的方式分配新列。DataFrame.drop() 方法从 DataFrame 中删除一列。...If/then逻辑 假设我们想要根据 total_bill 是小于还是大于 10 美元,来创建一个具有低值和高值的列。 在Excel电子表格中,可以使用条件公式进行逻辑比较。...查找子串的位置 FIND电子表格函数返回子字符串的位置,第一个字符为 1。 您可以使用 Series.str.find() 方法查找字符串列中字符的位置。find 搜索子字符串的第一个位置。...如果找到子字符串,则该方法返回其位置。如果未找到,则返回 -1。请记住,Python 索引是从零开始的。 tips["sex"].str.find("ale") 结果如下: 3.

19.6K20

如何使用Python中的装饰器创建具有实例化时间变量的新函数方法

1、问题背景在Python中,我们可以使用装饰器来修改函数或方法的行为,但当装饰器需要使用一个在实例化时创建的对象时,事情就会变得复杂。...例如,我们想要创建一个装饰器,可以创建一个新的函数/方法来使用对象obj。如果被装饰的对象是一个函数,那么obj必须在函数创建时被实例化。...如果被装饰的对象是一个方法,那么必须为类的每个实例实例化一个新的obj,并将其绑定到该实例。2、解决方案我们可以使用以下方法来解决这个问题:使用inspect模块来获取被装饰对象的签名。...如果被装饰的对象是一个方法,则将obj绑定到self。如果被装饰的对象是一个函数,则实例化obj。返回一个新函数/方法,该函数/方法使用obj。...然后,dec装饰器会返回一个新函数/方法,该函数/方法使用obj。请注意,这种解决方案只适用于对象obj在实例化时创建的情况。如果obj需要在其他时间创建,那么您需要修改此解决方案以适应您的具体情况。

9210
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    如何用 Python 执行常见的 Excel 和 SQL 任务

    在 Python 中,不需要知道很多关于正则表达式的知识,但它们是一个强大的工具,可用于匹配和替换某些字符串或子字符串。如果你想了解更多,请参考以下教程。 ? 信任这个网站的一些代码。...每个括号内的列表都代表了我们 dataframe 中的一行,每列都以 key 表示:我们正在处理一个国家的排名,人均 GDP(以美元表示)及其名称(用「国家」)。...通过这个简单的 Python 赋值给变量 gdp,我们现在有了一个 dataframe,可以在我们编写 gdp 的时候打开和浏览。我们可以为该词添加 Python 方法,以创建其中的数据的策略视图。...我们为一个新的 dataframe 分配一个布尔索引的过滤器,这个方法基本上就是说「创建一个人均 GDP 超过 50000 的新 dataframe」。现在我们可以显示gdp50000。 ?...有12个国家的 GDP 超过 50000! 选择属于以 s 开头的国家的行。 现在可以显示一个新 dataframe,其中只包含以 s 开头的国家。

    10.8K60

    python数据分析——数据的选择和运算

    主要有以下四种方式: 索引方式 使用场景 基础索引 获取单个元素 切片 获取子数组 布尔索引 根据比较操作,获取数组元素 数组索引 传递索引数组,更加快速,灵活的获取子数据集 数组的索引主要用来获得数组中的数据...数据获取 ①列索引取值 使用单个值或序列,可以从DataFrame中索引出一个或多个列。...类似于sql中的on用法。可以不指定,默认以2表中共同字段进行关联。 left_on和right_on:两个表里没有完全一致的列名,但是有信息一致的列,需要指定以哪个表中的字段作为主键。...代码如下: 2.使用join()方法合并数据集 join()是最常用的函数之一, join()方法用于将序列中的元素以指定的字符连接生成一个新的字符串。...关键技术:以学生成绩为例,数学成绩分别为120、89、98、78、65、102、112、56、 79、45的10名同学,现根据分数淘汰35%的学生,该如何处理?

    19310

    用Python执行SQL、Excel常见任务?10个方法全搞定!

    在 Python 中,不需要知道很多关于正则表达式的知识,但它们是一个强大的工具,可用于匹配和替换某些字符串或子字符串。如果你想了解更多,请参考以下内容。 ?...每个括号内的列表都代表了我们 dataframe 中的一行,每列都以 key 表示:我们正在处理一个国家的排名,人均 GDP(以美元表示)及其名称(用「国家」)。...通过这个简单的 Python 赋值给变量 gdp,我们现在有了一个 dataframe,可以在我们编写 gdp 的时候打开和浏览。我们可以为该词添加 Python 方法,以创建其中的数据的策略视图。...我们为一个新的 dataframe 分配一个布尔索引的过滤器,这个方法基本上就是说「创建一个人均 GDP 超过 50000 的新 dataframe」。现在我们可以显示gdp50000。 ?...有12个国家的 GDP 超过 50000! 选择属于以 s 开头的国家的行。 现在可以显示一个新 dataframe,其中只包含以 s 开头的国家。

    8.3K20

    Pandas入门2

    标题中的英文首字母大写比较规范,但在python实际使用中均为小写。...简单说明原因,并修改原始dataframe中的数据使得Mjob和Fjob列变为首字母大写 函数操作不影响原数据,返回值的新数据要赋值给原数据,如下面代码所示: df[['Mjob','Fjob']] =...df[['Mjob','Fjob']].applymap(str.title) Step 7.创建一个名为majority函数,并根据age列数据返回一个布尔值添加到新的数据列,列名为 legal_drinker...Python中的字符串处理 对于大部分应用来说,python中的字符串应该已经足够。 如split()函数对字符串拆分,strip()函数对字符串去除两边空白字符。...复习字符串对象的4个方法:join方法连接字符串、 find方法寻找子字符串出现的索引位置、count方法返回子字符串出现的次数、 replace方法用来替换。

    4.2K20

    快速提升效率的6个pandas使用小技巧

    从剪切板中创建DataFrame pandas中的read_clipboard()方法非常神奇,可以把剪切板中的数据变成dataframe格式,也就是说直接在excel中复制表格,可以快速转化为dataframe...将strings改为numbers 在pandas中,有两种方法可以将字符串改为数值: astype()方法 to_numeric()方法 先创建一个样本dataframe,看看这两种方法有什么不同。...检测并处理缺失值 有一种比较通用的检测缺失值的方法是info(),它可以统计每列非缺失值的数量。...对连续数据进行离散化处理 在数据准备过程中,常常会组合或者转换现有特征以创建一个新的特征,其中将连续数据离散化是非常重要的特征转化方式,也就是将数值变成类别特征。...从多个文件中构建一个DataFrame 有时候数据集可能分布在多个excel或者csv文件中,但需要把它读取到一个DataFrame中,这样的需求该如何实现?

    3.3K10

    独家 | PySpark和SparkSQL基础:如何利用Python编程执行Spark(附代码)

    作者:Pinar Ersoy 翻译:孙韬淳 校对:陈振东 本文约2500字,建议阅读10分钟 本文通过介绍Apache Spark在Python中的应用来讲解如何利用PySpark包执行常用函数来进行数据处理工作...通过名为PySpark的Spark Python API,Python实现了处理结构化数据的Spark编程模型。 这篇文章的目标是展示如何通过PySpark运行Spark并执行常用函数。...5) 分别显示子字符串为(1,3),(3,6),(1,6)的结果 6、增加,修改和删除列 在DataFrame API中同样有数据处理函数。...('new_column', F.lit('This is a new column')) display(dataframe) 在数据集结尾已添加新列 6.2、修改列 对于新版DataFrame API...API以RDD作为基础,把SQL查询语句转换为低层的RDD函数。

    13.7K21

    Python 算法交易秘籍(一)

    在步骤 5中,通过向构造函数传递columns参数以特定顺序的列来创建一个DataFrame,该参数是一个字符串列表。...重命名列、重新排列列、反转DataFrame,以及对DataFrame进行切片以提取行、列和数据子集。 准备工作完成 确保df对象在你的 Python 命名空间中可用。...如果不传递,其默认值为False,意味着将创建一个新的DataFrame而不是修改df。 重新排列:在步骤 2 中,你使用reindex()方法从df创建一个新的DataFrame,重新排列其列。...你通过传递columns参数以字符串列表的形式传递所需的顺序的列名。 反转:在步骤 3 中,你通过以一种特殊的方式使用索引运算符[::-1]从df创建一个新的DataFrame,其中的行被反转。...类似地,在 步骤 4 中,您通过按照 df 的 open 列降序排列来创建一个新的 DataFrame 对象。

    79450

    Pandas 2.2 中文官方教程和指南(四)

    查看如何从现有列创建新列。 过滤 在 Excel 中,过滤是通过图形菜单完成的。 数据框可以通过多种方式进行过滤;其中最直观的是使用布尔索引。...在 pandas 中,您可以直接对整个列进行操作。 通过在 DataFrame 中指定单独的 Series 来提供向量化操作。新列可以以相同的方式分配。...请参阅如何根据现有列创建新列。 过滤 在 Excel 中,过滤是通过一个图形菜单完成的。 DataFrame 可以以多种方式进行过滤;其中最直观的是使用布尔索引。...在电子表格中,公式通常在单独的单元格中创建,然后拖动到其他单元格中以计算其他列的值。...参见如何从现有列派生新列。 过滤 在 Excel 中,过滤是通过图形菜单完成的。 DataFrames 可以以多种方式进行过滤;其中最直观的是使用布尔索引。

    31710

    6个提升效率的pandas小技巧

    从剪切板中创建DataFrame pandas中的read_clipboard()方法非常神奇,可以把剪切板中的数据变成dataframe格式,也就是说直接在excel中复制表格,可以快速转化为dataframe...然后在python中执行pd.read_clipboard(),就能得到一模一样的dataframe数据表: pd.read_clipboard() ?...将strings改为numbers 在pandas中,有两种方法可以将字符串改为数值: astype()方法 to_numeric()方法 先创建一个样本dataframe,看看这两种方法有什么不同。...对连续数据进行离散化处理 在数据准备过程中,常常会组合或者转换现有特征以创建一个新的特征,其中将连续数据离散化是非常重要的特征转化方式,也就是将数值变成类别特征。...从多个文件中构建一个DataFrame 有时候数据集可能分布在多个excel或者csv文件中,但需要把它读取到一个DataFrame中,这样的需求该如何实现?

    2.9K20

    数据分析篇 | PyCon 大咖亲传 pandas 25 式,长文建议收藏

    这里要注意的是,字符串里的字符数量必须与 DataFrame 的列数一致。 3. 重命名列 ? 用点(.)选择 pandas 里的列写起来比较容易,但列名里有空格,就没法这样操作了。...还可以使用 exclude 关键字排除指定的数据类型。 ? 7. 把字符串转换为数值 再创建一个新的 DataFrame 示例。 ?...把字符串分割为多列 创建一个 DataFrame 示例。 ? 把姓名列分为姓与名两列,用 str.split() 方法,按空格分割,并用 expand 关键字,生成一个新的 DataFrame。 ?...把 Series 里的列表转换为 DataFrame 创建一个 DataFrame 示例。 ? 这里包含了两列,第二列包含的是 Python 整数列表。...年龄列有 1 位小数,票价列有 4 位小数,如何将这两列显示的小数位数标准化? 用以下代码让这两列只显示 2 位小数。 ? 第一个参数是要设置的选项名称,第二个参数是 Python 的字符串格式。

    7.2K20

    【精心解读】用pandas处理大数据——节省90%内存消耗的小贴士

    下图所示为pandas如何存储我们数据表的前十二列: 可以注意到,这些数据块没有保持对列名的引用,这是由于为了存储dataframe中的真实数据,这些数据块都经过了优化。...因为Python是一种高层、解析型语言,它没有提供很好的对内存中数据如何存储的细粒度控制。 这一限制导致了字符串以一种碎片化方式进行存储,消耗更多的内存,并且访问速度低下。...在object列中的每一个元素实际上都是存放内存中真实数据位置的指针。 下图对比展示了数值型数据怎样以Numpy数据类型存储,和字符串怎样以Python内置类型进行存储的。...由于一个指针占用1字节,因此每一个字符串占用的内存量与它在Python中单独存储所占用的内存量相等。...你可以看到这些字符串的大小在pandas的series中与在Python的单独字符串中是一样的。

    8.7K50

    python数据分析——数据预处理

    4.2处理异常值 了解异常值的检测后,接下来介绍如何处理异常值。在数据分析的过程中,对异常值的处理通常包括以下3种方法: 最常用的方式是删除。 将异常值当缺失值处理,以某个值填充。...本案例的代码及运行结果如下。 七、其他 7.1大小写转换 在数据分析中,有时候需要将字符串中的字符进行大小写转换。在Python中可以使用lower()方法,将字符串中的所有大写字母转换为小写字母。...7.2数据修改与替换 按列增加数据 【例】请创建如下所示的DataFrame数据,并利用Python对该数据的最后增加一列数据,要求数据的列索引为'four' ,数值为[9,10,24]。...若要在该数据的'two' 列和 ‘three'列之间增加新的列,该如何操作?...7.3数据删除 按列删除数据 【例】请构建如下DataFrame数据并利用Python删除下面DataFrame实例的第四列数据。

    94410

    6个提升效率的pandas小技巧

    从剪切板中创建DataFrame pandas中的read_clipboard()方法非常神奇,可以把剪切板中的数据变成dataframe格式,也就是说直接在excel中复制表格,可以快速转化为dataframe...然后在python中执行pd.read_clipboard(),就能得到一模一样的dataframe数据表: pd.read_clipboard() ?...将strings改为numbers 在pandas中,有两种方法可以将字符串改为数值: astype()方法 to_numeric()方法 先创建一个样本dataframe,看看这两种方法有什么不同。...对连续数据进行离散化处理 在数据准备过程中,常常会组合或者转换现有特征以创建一个新的特征,其中将连续数据离散化是非常重要的特征转化方式,也就是将数值变成类别特征。...从多个文件中构建一个DataFrame 有时候数据集可能分布在多个excel或者csv文件中,但需要把它读取到一个DataFrame中,这样的需求该如何实现?

    2.4K20

    Python 数据分析(PYDA)第三版(四)

    在某些情况下,以这种格式处理数据可能更加困难;您可能更喜欢拥有一个 DataFrame,其中包含一个以date列中的时间戳为索引的每个不同item值的列。...与在新的 DataFrame 中将一个列转换为多个不同,它将多个列合并为一个,生成一个比输入更长的 DataFrame。...为了更方便地创建子图网格,matplotlib 包括一个 plt.subplots 方法,它创建一个新图并返回一个包含创建的子图对象的 NumPy 数组: In [25]: fig, axes = plt.subplots...要获取全面的列表,请参考 IPython 或 Jupyter 中的文档字符串。 表 9.2:一些fig.savefig选项 参数 描述 fname 包含文件路径或 Python 文件对象的字符串。...DataFrame 有许多选项,允许对列的处理方式进行一定的灵活性,例如,是否将它们全部绘制在同一个子图上,还是创建单独的子图。更多信息请参见 表 9.4。

    31200

    Python数据分析实战基础 | 初识Pandas

    它提供了两种类型的数据结构,分别是DataFrame和Series,我们可以简单粗暴的把DataFrame理解为Excel里面的一张表,而Series就是表中的某一列,后面学习和用到的所有Pandas骚操作...03 创建、读取和存储 1、创建 在Pandas中我们想要构造下面这一张表应该如何操作呢? ?...实践中数据源的格式一般都是比较规整的,更多情况是直接读取。 3、存储 存储起来一样非常简单粗暴且相似: ?...1、增 增加一列,用df['新列名'] = 新列值的形式,在原数据基础上赋值即可: ?...在实际业务中,一些时候PANDAS会把文件中日期格式的字段读取为字符串格式,这里我们先把字符串'2019-8-3'赋值给新增的日期列,然后用to_datetime()函数将字符串类型转换成时间格式: ?

    2K12

    Python数据分析实战基础 | 初识Pandas

    它提供了两种类型的数据结构,分别是DataFrame和Series,我们可以简单粗暴的把DataFrame理解为Excel里面的一张表,而Series就是表中的某一列,后面学习和用到的所有Pandas骚操作...03 创建、读取和存储 1、创建 在Pandas中我们想要构造下面这一张表应该如何操作呢? ?...实践中数据源的格式一般都是比较规整的,更多情况是直接读取。 3、存储 存储起来一样非常简单粗暴且相似: ?...1、增 增加一列,用df['新列名'] = 新列值的形式,在原数据基础上赋值即可: ?...在实际业务中,一些时候PANDAS会把文件中日期格式的字段读取为字符串格式,这里我们先把字符串'2019-8-3'赋值给新增的日期列,然后用to_datetime()函数将字符串类型转换成时间格式: ?

    1.8K30
    领券