首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

【数据处理包Pandas】数据透视表

首先,导入 NumPy 和 Pandas 库。...import numpy as np import pandas as pd 一、通过多级索引创建数据透视表 利用多级索引产生学生成绩表: r_index = pd.MultiIndex.from_product...df2.reindex(columns=[('富强','数学'),('李海','英语'),('王亮','数学'),('富强','语文')]) 二、数据透视表   数据透视表相当于在行和列两个维度上进行分组...数据透视表的效果可以通过groupby来实现,但有时候直接使用pivot_table方法建立数据透视表可能更方便些,而且额外提供了汇总功能。...第1个参数是data参数,提供了绘制数据透视表的数据来源,可以是整个 DataFrame,也可以是 DataFrame 的子集;index和columns参数指定了行分组键和列分组键;values指定想要聚合的数据字段名

9000
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    一行Pandas代码制作数据分析透视表,太牛了

    相信大家都用在Excel当中使用过数据透视表(一种可以对数据动态排布并且分类汇总的表格格式),也体验过它的强大功能,在Pandas模块当中被称作是pivot_table,今天小编就和大家来详细聊聊该函数的主要用途...导入模块和读取数据 那我们第一步仍然是导入模块并且来读取数据,数据集是北美咖啡的销售数据,包括了咖啡的品种、销售的地区、销售的利润和成本、销量以及日期等等 import pandas as pd def...读者也可以根据自己的习惯来进行数据的读取 df = load_data() df.head() output 通过调用info()函数先来对数据集有一个大致的了解 df.info() output pandas.core.frame.DataFrame...object(4) memory usage: 298.8+ KB 初体验 在pivot_table函数当中最重要的四个参数分别是index、values、columns以及aggfunc,其中每个数据透视表都必须要有一个...index=['region', 'product_category'], values=['sales'], aggfunc='sum') output 同时我们看到当中存在着一些缺失值,我们可以选择将这些缺失值替换掉

    91740

    在pandas中使用数据透视表

    什么是透视表? 经常做报表的小伙伴对数据透视表应该不陌生,在excel中利用透视表可以快速地进行分类汇总,自由组合字段聚合计算,而这些只需要拖拉拽就能实现。...透视表是一种汇总了更广泛表数据的统计信息表。 典型的数据格式是扁平的,只包含行和列,不方便总结信息: ? 而数据透视表可以快速抽取有用的信息: ? pandas也有透视表?...pandas作为编程领域最强大的数据分析工具之一,自然也有透视表的功能。 在pandas中,透视表操作由pivot_table()函数实现,不要小看只是一个函数,但却可以玩转数据表,解决大麻烦。...注意,在所有参数中,values、index、columns最为关键,它们分别对应excel透视表中的值、行、列: ?...总结 本文介绍了pandas pivot_table函数的使用,其透视表功能基本和excel类似,但pandas的聚合方式更加灵活和多元,处理大数据也更快速,大家有兴趣可探索更高级的用法。

    2.8K40

    资源 | Pandas on Ray:仅需改动一行代码,即可让Pandas加速四倍

    作者还对 Pandas on Ray、Pandas 进行了对比评估。机器之心对此文进行了编译介绍。...目前,Apache Spark 是最高性能的分布式选择了,但是如果未对 Pandas 代码做出足够多的修改,你无法使用 Apache Spark 运行 Pandas 代码。...我们对系统进行了初步测评,Pandas on Ray 可以在一台 8 核的机器上将 Pandas 的查询速度提高了四倍,而这仅需用户在 notebooks 中修改一行代码。...5 2013-02-15 6 2013-02-19 7 2013-02-20 8 2013-02-21 9 2013-02-22 Name: date, dtype: object 看上去是个正确的选择...结论 我们已经开始构建 Pandas on Ray,这是一个仅更改 import 语句就可以使 Pandas 工作流并行化的库。

    3.4K30

    仅需添加一行代码,即可让Pandas加速四倍 | Pandas on Ray

    快来了解新库Modin,可以分割pandas的计算量,提高数据处理效率,一行代码即刻开启Pandas四倍速。...但对于计算量繁杂的大数据集来说,仅使用单内核会导致运行速度非常缓慢。有些数据集可能有百万条甚至上亿条数据,如果每次都只进行一次运算,只用一个CPU,速度会很慢。 绝大多数现代电脑都有至少两个CPU。...不管有多少行,多少列,或者两者都很多,它都能游刃有余地处理。 ? Pandas DataFrame(左)作为整体储存,只交给一个CPU处理。...运行了.fillna()仅花了1.8秒,而Modin只用了0.21秒,快了8.57倍!...图源:Unsplash 有时Pandas会比Modin快一些,即使在处理这个有5,992,097(接近6百万)行的数据时。下列表格对比展示了笔者分别使用Pandas和Modin做测试的运行时间。

    5.6K30

    Pandas透视表及应用

    Pandas 透视表概述 数据透视表(Pivot Table)是一种交互式的表,可以进行某些计算,如求和与计数等。所进行的计算与数据跟数据透视表中的排列有关。...之所以称为数据透视表,是因为可以动态地改变它们的版面布置,以便按照不同方式分析数据,也可以重新安排行号、列标和页字段。每一次改变版面布置时,数据透视表会立即按照新的布置重新计算数据。...另外,如果原始数据发生更改,则可以更新数据透视表。...Pandas pivot_table函数介绍:pandas有两个pivot_table函数 pandas.pivot_table pandas.DataFrame.pivot_table pandas.pivot_table...:dataframe.pivot_table() index:行索引,传入原始数据的列名 columns:列索引,传入原始数据的列名 values: 要做聚合操作的列名 aggfunc:聚合函数  custom_info.pivot_table

    24910

    对比Excel,学习pandas数据透视表

    Excel中做数据透视表 ① 选中整个数据源; ② 依次点击“插入”—“数据透视表” ③ 选择在Excel中的哪个位置,插入数据透视表 ④ 然后根据实际需求,从不同维度展示结果 ⑤ 结果如下 pandas..."中的行; columns 相当于上述"数据透视表字段"中的列; values 相当于上述"数据透视表字段"中的值; aggfunc 相当于上述"结果"中的计算类型; margins 相当于上述"结果"...案例说明 1)求出不同品牌下,每个月份的销售数量之和 ① 在Excel中的操作结果如下 ② 在pandas中的操作如下 df = pd.read_excel(r"C:\Users\黄伟\Desktop\...values="销售数量",aggfunc=np.sum) display(df1) 结果如下: 2)求出不同品牌下,每个地区、每个月份的销售数量之和 ① 在Excel中的操作结果如下 ② 在pandas...values="销售数量",aggfunc=np.sum) display(df1) 结果如下: 3)求出不同品牌不同地区下,每个月份的销售数量之和 ① 在Excel中的操作结果如下 ② 在pandas

    1.6K20

    Pandas进阶|数据透视表与逆透视

    在实际数据处理过程中,数据透视表使用频率相对较高,今天云朵君就和大家一起学习pandas数据透视表与逆透视的使用方法。...数据基本情况 groupby数据透视表 使用 pandas.DataFrame.groupby 函数,其原理如下图所示。...根据 GroupBy 的操作流程,我们也许能够实现想要的结果:将司机种族('driver_race')与司机性别('driver_gender')分组,然后选择司机年龄('driver_age')列,应用均值...默认聚合所有数值列 index 用于分组的列名或其他分组键,出现在结果透视表的行 columns 用于分组的列名或其他分组键,出现在结果透视表的列 aggfunc 聚合函数或函数列表,默认为'mean'...pandas.crosstab 参数 index:指定了要分组的列,最终作为行。 columns:指定了要分组的列,最终作为列。

    4.3K11

    对比Excel,学习pandas数据透视表

    Excel中做数据透视表 ① 选中整个数据源; ② 依次点击“插入”—“数据透视表” ③ 选择在Excel中的哪个位置,插入数据透视表 ④ 然后根据实际需求,从不同维度展示结果 ⑤ 结果如下 pandas..."中的行; columns 相当于上述"数据透视表字段"中的列; values 相当于上述"数据透视表字段"中的值; aggfunc 相当于上述"结果"中的计算类型; margins 相当于上述"结果"...案例说明 1)求出不同品牌下,每个月份的销售数量之和 ① 在Excel中的操作结果如下 ② 在pandas中的操作如下 df = pd.read_excel(r"C:\Users\黄伟\Desktop\...values="销售数量",aggfunc=np.sum) display(df1) 结果如下: 2)求出不同品牌下,每个地区、每个月份的销售数量之和 ① 在Excel中的操作结果如下 ② 在pandas...values="销售数量",aggfunc=np.sum) display(df1) 结果如下: 3)求出不同品牌不同地区下,每个月份的销售数量之和 ① 在Excel中的操作结果如下 ② 在pandas

    1.7K10

    Pandas学习笔记05-分组与透视

    pandas提供了比较灵活的groupby分组接口,同时我们也可以使用pivot_table进行透视处理。 1.分组 分组函数groupby,对某列数据进行分组,返回一个Groupby对象。 ?...自由选择返回结果类型 有时候,我们可以通过传递函数进行分组,简化代码 ? 使用函数进行分组 2.聚合 常见的聚合函数如下: 计算组的平均值 ? 演示数据 简单的分组聚合操作 ?...不同的聚合方法 3.数据透视 数据透视采用pivot_table方法,和excel数据透视表功能类似,其实可以和groupby分组统计进行相互转化 它带有许多参数: data:一个DataFrame对象...在数据透视表索引上进行分组的键。如果传递了数组,则其使用方式与列值相同。 columns:与数据或它们的列表具有相同长度的列,Grouper,数组。在数据透视表列上进行分组的键。...演示数据 数据透视操作 ? 简单的数据透视对不同列使用不同的方法 ? 对不同列使用不同方法 margins增加合计项 ? 合计项 嗨,你还在看吗?

    1K30

    【说站】Python Pandas数据框如何选择行

    Python Pandas数据框如何选择行 说明 1、布尔索引( df[df['col'] == value] ) 2、位置索引( df.iloc[...]) 3、标签索引( df.xs(...))...假设我们的标准是 column 'A'=='foo' (关于性能的注意事项:对于每个基本类型,我们可以通过使用 Pandas API 来保持简单,或者我们可以在 API 之外冒险,通常进入 NumPy,...设置 我们需要做的第一件事是确定一个条件,该条件将作为我们选择行的标准。我们将从 OP 的案例开始column_name == some_value,并包括一些其他常见用例。...借用@unutbu: import pandas as pd, numpy as np df = pd.DataFrame({'A': 'foo bar foo bar foo bar foo foo'...数据框选择行的方法,希望对大家有所帮助。

    1.5K40

    利用excel与Pandas完成实现数据透视表

    数据透视表是一种分类汇总数据的方法。本文章将会介绍如何用Pandas完成数据透视表的制作和常用操作。...1,制作数据透视表 制作数据透视表的时候,要确定这几个部分:行字段、列字段、数据区,汇总函数。数据透视表的结构如图1所示。...图2 Excel制作数据透视表 Pandas里制作数据透视表主要使用pivot_table方法。...图11 仅保留结果的某些行 (5)仅保留汇总数据某些行和列。 pt[['A', 'B', 'C']].loc[['洗衣机', '电风扇']] 输出结果如图12所示。...图12 仅保留汇总数据某些行和列 3,使用字段列表排列数据透视表中的数据 数据透视表是一个DataFrame,所以可以用sort_values方法来按某列排序,示例代码如下: pt = df.pivot_table

    2.3K40

    在pandas中使用数据透视表

    透视表是一种汇总了更广泛表数据的统计信息表。 典型的数据格式是扁平的,只包含行和列,不方便总结信息: 而数据透视表可以快速抽取有用的信息: pandas也有透视表?...pandas作为编程领域最强大的数据分析工具之一,自然也有透视表的功能。 在pandas中,透视表操作由pivot_table()函数实现,不要小看只是一个函数,但却可以玩转数据表,解决大麻烦。...,一般是用于分组的列名或其他分组键,作为结果DataFrame的行索引 columns:列分组键,一般是用于分组的列名或其他分组键,作为结果DataFrame的列索引 aggfunc:聚合函数或函数列表...、行、列: 参数aggfunc对应excel透视表中的值汇总方式,但比excel的聚合方式更丰富: 如何使用pivot_table?...pivot_table函数的使用,其透视表功能基本和excel类似,但pandas的聚合方式更加灵活和多元,处理大数据也更快速,大家有兴趣可探索更高级的用法。

    3K20

    pandas系列7-透视表和交叉表

    透视表pivot_table是各种电子表格和其他数据分析软件中一种常见的数据分析汇总工具。...根据一个或者多个键对数据进行聚合 根据行和列上的分组键将数据分配到各个矩形区域中 一文看懂pandas的透视表 Pivot_table 特点 灵活性高,可以随意定制你的分析计算要求 脉络清晰易于理解数据...关于pivot_table函数结果的说明: df是需要进行透视表的数据框 values是生成的透视表中的数据 index是透视表的层次化索引,多个属性使用列表的形式 columns是生成透视表的列属性...Crosstab 一种用于计算分组频率的特殊透视表。...party_counts = pd.crosstab(df['day'], df['size']) # 第一个参数是行索引,第二个参数是列属性 # 使用loc,定位取出固定的行和列数据 party_counts

    1.2K11
    领券