首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

干货!直观地解释和可视化每个复杂的DataFrame操作

操作数据帧可能很快会成为一项复杂的任务,因此在Pandas的八种技术均提供了说明,可视化,代码和技巧来记住如何做。 ?...Stack 堆叠采用任意大小的DataFrame,并将列“堆叠”为现有索引的子索引。因此,所得的DataFrame仅具有一列和两级索引。 ? 堆叠名为df的表就像df.stack()一样简单 。...为了访问狗的身高值,只需两次调用基于索引的检索,例如 df.loc ['dog']。loc ['height']。 要记住:从外观上看,堆栈采用表的二维性并将列堆栈为多级索引。...使用联接时,公共键列(类似于 合并的right_on 和 left_on)必须命名为相同的名称。...由于每个索引/行都是一个单独的项目,因此串联将其他项目添加到DataFrame,这可以看作是行的列表。

13.3K20
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    5分钟了解Pandas的透视表

    Pandas 库是用于数据分析的流行 Python 包。Pandas 处理数据集时,结构将是二维的,由行和列组成,也称为dataframe。...在下面的文章,我将通过代码示例简要介绍 Pandas 数据透视表工具。 数据 在本教程,我将使用一个名为“autos”的数据集。...该数据集包含有关汽车的一系列特征,例如品牌、价格、马力和每公里油耗等。 数据可以从 openml 下载。或者可以使用 scikit-learn API 将代码直接导入到代码,如下所示。...索引指定行级分组,列指定列级分组和值,这些值是您要汇总的数值。 用于创建上述数据透视表的代码如下所示。在 pivot_table 函数,我们指定要汇总的df,然后是值、索引和列的列名。...Pandas 数据透视表将这个工具从电子表格带到了 python 用户的手中。 本指南简要介绍了 Pandas 数据透视表工具的使用。

    1.9K50

    Pandas

    同样的对行的索引方式也支持对列使用。 多级索引 多级索引提供了一种以一个较低维度的形式访问高维数据的方法,每次一个维度的索引都相当于对原数据进行一次降维。...多级索引建立与单个索引相似,只需将每一级各个值对应的索引名称传给 index 参数即可,每一级的索引单独组成一个列表,传入 index 的参数应为列表的嵌套。...以加法为例,它会匹配索引相同(行和列)的进行算术运算,再将索引不匹配的数据视作缺失值,但是也会添加到最后的运算结果,从而组成加法运算的结果。...()方法 多个 dataframe 连接(通过 index 匹配进行)(Join and Merge) 通过一个或多个键将两个数据集的列连接起来(完成 SQl 的 join 操作):pandas.merge...()函数和pandas.DataFrame.join()方法,多表的连接要把被连接的 df 名称以列表的形式传入 pd.merge(df1,df2,on=‘column_name’) pd.merge

    9.2K30

    BAT面试题53:了解如何重置索引多级索引吗?

    01 现在,我们想重置上面说到的行、列索引Pandas实现行索引重置功能的API:reset_index: 函数原型如下: ? 参数如下: ?...level参数为:多级索引才会用到,一般常见的都为单级索引;drop控制行索引是否添加到数据;inplace:是否改变发生在数据本身;col_level:多级列插入标签到哪一个;col_fill:其他级怎么被...上面的df,执行此API操作后,变为如下:默认行索引进入到数据列。 ?...pandas框架下怎么实现? ? 多级索引下执行reset_index,如我们想象,两级行索引都融入到数据域中: ? 如果,只想class索引融入进去,借助level参数: ?...以上,Pandas框架下索引重置,多级索引用法。

    73620

    Pandas图鉴(三):DataFrames

    Pandas 图鉴系列文章由四个部分组成: Part 1. Motivation:Pandas图鉴(一):Pandas vs Numpy Part 2....向Pandas提供列的名称而不是整数标签(使用列参数),有时提供行的名称。...就像1:1的关系一样,要在Pandas连接一对1:n的相关表,你有两个选择。...注意:要小心,如果第二个表有重复的索引值,你会在结果中出现重复的索引值,即使左表的索引是唯一的 有时,连接的DataFrame有相同名称的列。...要将其转换为宽格式,请使用df.pivot: 这条命令抛弃了与操作无关的东西(即索引和价格列),并将所要求的三列信息转换为长格式,将客户名称放入结果的索引,将产品名称放入其列,将销售数量放入其 "

    40020

    手把手教你做一个“渣”数据师,用Python代替老情人Excel

    请按照以下链接下载数据,并将其放在与存储Python文件的同一文件夹。...2、一些重要的Pandas read_excel选项 ? 如果默认使用本地文件的路径,用“\”表示,接受用“/”表示,更改斜杠可以将文件添加到Python文件所在的文件夹。...4、使用工作表的列作为索引 除非明确提到,否则索引列会添加到DataFrame,默认情况下从0开始。...1、查看列 包括以下三种主要方法: 使用点符号:例如data.column_name 使用方括号和列名称:数据[“COLUMN_NAME”] 使用数字索引和iloc选择器:data.loc [:,'column_number...不幸的是Pandas并没有vlookup功能! 由于Pandas没有“Vlookup”函数,因此Merge用与SQL相同的备用函数。

    8.4K30

    Pandas知识点-添加操作append

    Pandas,append()方法用于将一个或多个DataFrame或Series添加到DataFrame。append()方法也可以用于合并操作,本文介绍append()方法的用法。...指定Series的name参数,这样Series将以name参数作为行索引添加到DataFrame。...合并时根据指定的连接列(或行索引)和连接方式来匹配两个DataFrame的行。可以在结果设置相同列名的后缀和显示连接列是否在两个DataFrame中都存在。...append(): 添加操作,可以将多个DataFrame添加到一个DataFrame,按行的方式进行添加。添加操作只是将多个DataFrame按行拼接到一起,可以重设行索引。...> 参考文档:https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.append.html

    4.8K30

    《Python for Excel》读书笔记连载11:使用pandas进行数据分析之组合数据

    进行数据分析之核心数据结构——数据框架和系列 10.使用pandas进行数据分析之数据操作 组合数据框架 在Excel组合不同的数据集可能是一项繁琐的任务,通常涉及许多VLOOKUP公式。...连接(concatenating) 要简单地将多个数据框架粘合在一起,最好使用concat函数。从函数的名称可以看出,其处理过程具有技术名称串联(concatenation)。...在下面的示例,创建了另一个数据框架more_users,并将其附加到示例数据框架df的底部: 注意,现在有了重复的索引元素,因为concat将数据粘在指定的轴(行)上,并且只对齐另一个轴(列)上的数据...左联接(leftjoin)获取左数据框架df1的所有行,并在索引上匹配右数据框架df2的行,在df2没有匹配行的地方,pandas将填充NaN。左联接对应于Excel的VLOOKUP情况。...右联接(rightjoin)获取右表df2的所有行,并将它们与df1索引相同的行相匹配。

    2.5K20

    最全面的Pandas的教程!没有之一!

    如上图的 out[24] 中所示,如果你从一个 Python 字典对象创建 Series,Pandas 会自动把字典的键值设置成 Series 的 index,并将对应的 values 放在和索引对应的...最后,将这个多级索引对象转成一个 DataFrame: ? 要获取多级索引的数据,还是用到 .loc[] 。比如,先获取 'O Level' 下的数据: ?...交叉选择行和列的数据 我们可以用 .xs() 方法轻松获取到多级索引某些特定级别的数据。比如,我们需要找到所有 Levels ,Num = 22 的行: ?...image 连接(Join) 如果你要把两个表连在一起,然而它们之间没有太多共同的列,那么你可以试试 .join() 方法。和 .merge() 不同,连接采用索引作为公共的键,而不是某一列。 ?...数据透视表是一种汇总统计表,它展现了原表格数据的汇总统计结果。Pandas 的数据透视表能自动帮你对数据进行分组、切片、筛选、排序、计数、求和或取平均值,并将结果直观地显示出来。

    25.9K64

    Pandas处理时间序列数据的20个关键知识点

    举几个例子: 一段时间内的股票价格 每天,每周,每月的销售额 流程的周期性度量 一段时间内的电力或天然气消耗率 在这篇文章,我将列出20个要点,帮助你全面理解如何用Pandas处理时间序列数据。...用to_datetime和to_timedelta创建时间序列 可以通过将TimedeltaIndex添加到时间戳来创建DatetimeIndex。...让我们创建一个包含30个值和一个时间序列索引的Panda系列。...例如,在上一步创建的系列,我们可能只需要每3天(而不是平均3天)一次的值。 S.asfreq('3D') 20.滚动 滚动对于时间序列数据是一种非常有用的操作。...值得注意的是,计算开始时整个窗口都在数据。换句话说,如果窗口的大小为3,那么第一次合并将在第三行进行。 让我们为我们的数据应用一个3天的滚动窗口。

    2.7K30

    对比Excel,Python pandas删除数据框架的行

    标签:Python与Excel,pandas 对于Excel来说,删除行是一项常见任务。本文将学习一些从数据框架删除行的技术。...准备数据框架 我们将使用前面系列中用过的“用户.xlsx”来演示删除行。 图1 注意上面代码的index_col=0?如果我们将该参数留空,则索引将是基于0的索引。...通过指定index_col=0,我们要求pandas使用第一列(用户姓名)作为索引。...按名称删除行 图2 我们跳过了参数axis,这意味着将其保留为默认值0或行。因此,我们正在删除索引值为“Harry Porter”的行。还要注意.drop()方法还返回结果数据框架。...我们可以使用布尔索引方便地筛选行,这里我们还可以使用它方便地删除行。这次我们将从数据框架删除带有“Jean Grey”的行,并将结果赋值到新的数据框架。 图6

    4.6K20

    Python数据分析 | 数据分析工具库Pandas介绍

    Pandas名称来自于面板数据(panel data)和python数据分析(data analysis)。...本篇为pandas系列的导语,对pandas进行简单介绍,整个系列覆盖以下内容: 图解Pandas核心操作函数大全 图解Pandas数据变换高级函数 Pandas数据分组与操作 二、Pandas特点 方便地处理浮点与非浮点数据里的缺失数据...Series、DataFrame 计算时自动与数据对齐; 强大、灵活的分组(group by)功能:拆分-应用-组合数据集,聚合、转换数据; 把 Python 和 NumPy 数据结构里不规则、不同索引的数据轻松地转换为...DataFrame 对象; 基于智能标签,对大型数据集进行切片、花式索引、子集分解等操作; 直观地合并(merge)、连接(join)数据集; 灵活地重塑(reshape)、透视(pivot)数据集;...系列教程推荐 图解Python编程:从入门到精通系列教程 图解数据分析:从入门到精通系列教程 图解AI数学基础:从入门到精通系列教程 图解大数据技术:从入门到精通系列教程

    1.6K51
    领券