Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >利用 Python 生成数据透视表

利用 Python 生成数据透视表

作者头像
zucchiniy
发布于 2020-05-22 06:39:50
发布于 2020-05-22 06:39:50
2K00
代码可运行
举报
文章被收录于专栏:洞明学问洞明学问
运行总次数:0
代码可运行

简介

  • 利用 read_excel()usecols 参数来指定表的某一列,以方便排除不必要的干扰列
  • 养成数据加载以后,使用 head() 进行预览的习惯
  • 养成使用 shape()info() 了解表格基本情况的习惯

利用 info() 方法查看数据中是否有空值,如果有空值的话,则可以使用 dropna() 方法将其移除。

需要掌握的主要有两个方法:

  • DataFrame.insert() 方法,用来增加对应的列
  • DataFrame.pivot_table() 产生透视图,展示重要的数据

具体方法

  • DataFrame.insert(self, loc, column, value, allow_duplicates=False)

loc : int 表示第几列;0 <= loc <= len(columns) column : string, number, or hashable object;给插入的列取名,如 column=‘新的一列’ value : int ,array,series allow_duplicates : bool 是否允许列名重复,选择 True 表示允许新的列名与已存在的列名重复。

  • DataFrame.pivot_table(self, values=None, index=None, columns=None, aggfunc='mean', fill_value=None, margins=False, dropna=True, margins_name='All', observed=False)

values : 要进行透视展示的数据 index : 需要重新进行展示成列,是原始数据中的某一个行 columns : 要重新展示为行的内容,是原来的列或者是其它的属性,可以是列表 aggfunc : 要进行统计的行,可以是 numpy.sum / numpy.mean 等,也可以按列进行统计 aggfunc={'c1' : numpy.mean, 'c2' : numpy.sum} fill_value : 将缺失值替换的值,幽灵将 Nan 换成 0 : fill_value=0 margins : bool, 增加行或者列的汇总信息 dropna : bool ,是否要删除为空的信息 margin_name : string , 默认为 all ,或者自定义一个名称 observed bool , True 显示分类中的数据,False 显示所有数据,默认为 False

示例代码

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import pandas as pd
from datetime import datetime

data = pd.read_excel(r'python_learning.xlsx',
                     usecols=[1, 4, 6, 7, 8, 9, 10, 11, 12], sheet_name='sheetName')
data = data[data['合同生效日'] > datetime(2018, 12, 31)]

# 按逻辑,将一组数据拆成三组
data1 = data[["used", "loan amount", "company1", "percent1"]]
data2 = data[["used", "loan amount", "company2", "percent2"]]
data3 = data[["used", "loan amount", "company3", "percent3"]]

# 将三组内容,重新命名之后合成一个新表
data1 = data1.rename(columns={"company1": "company", "percent1": "percent"})
data2 = data2.rename(columns={"company2": "company", "percent2": "percent"})
data3 = data3.rename(columns={"company3": "company", "percent3": "percent"})

data4 = pd.concat([data1, data2, data3], ignore_index=True)

# 将数据中的空值清除
data4 = data4.dropna()

# 插入新的数据
# 1. insert() 方法
data4.insert(2, "devide percent", data4["percent"]/100)
data4.insert(5, "devide amount", data4["loan amount"]*data4["deivide percent"]/10000, False)

# 普通索引方式插入
# data4["loan divide amount"] = data4["load amount"]*data4["deivide percent"]/10000

# 增加数据透视
data5 = data4[['company', 'used', 'loan amount']]
data6 = pd.pivot_table(data5, values="loan divide amount", columns="used", index="company",
                       aggfunc='sum', fill_value=0, observed=False).reset_index()
print(data6.head())
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019-08-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
自动化生成报表
利用 info() 方法查看数据中是否有空值,如果有空值的话,则可以使用 dropna() 方法将其移除。
zucchiniy
2019/10/30
9470
技术|数据透视表,Python也可以
对于熟悉Excel的小伙伴来说,学习Python的时候就按照没个功能在Python中如何实现进行学习就可以啦~
做数据的二号姬
2020/05/22
2.3K0
在pandas中使用数据透视表
经常做报表的小伙伴对数据透视表应该不陌生,在excel中利用透视表可以快速地进行分类汇总,自由组合字段聚合计算,而这些只需要拖拉拽就能实现。
bugsuse
2020/11/06
3.1K0
在pandas中使用数据透视表
pandas系列7-透视表和交叉表
透视表pivot_table是各种电子表格和其他数据分析软件中一种常见的数据分析汇总工具。 根据一个或者多个键对数据进行聚合 根据行和列上的分组键将数据分配到各个矩形区域中 一文看懂pandas的透视表 Pivot_table 特点 灵活性高,可以随意定制你的分析计算要求 脉络清晰易于理解数据 操作性强,报表神器 参数 data: a DataFrame object,要应用透视表的数据框 values: a column or a list of columns to aggregate,要聚合的列
皮大大
2021/03/02
1.3K0
对比Excel,学习pandas数据透视表
Excel中做数据透视表 ① 选中整个数据源; ② 依次点击“插入”—“数据透视表” ③ 选择在Excel中的哪个位置,插入数据透视表 ④ 然后根据实际需求,从不同维度展示结果 ⑤ 结果如下 pand
朱小五
2020/02/24
1.7K0
对比Excel,学习pandas数据透视表
【数据处理包Pandas】数据透视表
使用stack方法把列索引变成行索引(默认是把最低级列索引变成最低级行索引),此时行索引有3级。
Francek Chen
2025/01/22
2940
【数据处理包Pandas】数据透视表
python-for-data-groupby使用和透视表
第十章主要讲解的数据聚合与分组操作。对数据集进行分类,并在每一个组上应用一个聚合函数或者转换函数,是常见的数据分析的工作。
皮大大
2021/03/01
2.1K0
python-for-data-groupby使用和透视表
Pandas进阶|数据透视表与逆透视
数据透视表将每一列数据作为输入,输出将数据不断细分成多个维度累计信息的二维数据表。在实际数据处理过程中,数据透视表使用频率相对较高,今天云朵君就和大家一起学习pandas数据透视表与逆透视的使用方法。
数据STUDIO
2021/09/26
4.6K0
Pandas进阶|数据透视表与逆透视
Pandas中使用pivot_table函数进行高级数据汇总
Pandas的pivot_table函数是一个强大的数据分析工具,可以帮助我们快速地对数据进行汇总和重塑。
Ai学习的老章
2024/09/18
2960
Pandas中使用pivot_table函数进行高级数据汇总
数据科学 IPython 笔记本 7.12 透视表
我们已经看到GroupBy抽象如何让我们探索数据集中的关系。透视表是一种类似的操作,常见于电子表格,和其他操作表格数据的程序中。透视表将简单的逐列数据作为输入,并将条目分组为二维表格,该表提供数据的多维汇总。
ApacheCN_飞龙
2022/06/03
1.1K0
数据科学 IPython 笔记本 7.12 透视表
【Python常用函数】一文让你彻底掌握Python中的pivot_table函数
只有把一个语言中的常用函数了如指掌了,才能在处理问题的过程中得心应手,快速地找到最优方案。
阿黎逸阳
2023/08/21
9.9K0
【Python常用函数】一文让你彻底掌握Python中的pivot_table函数
利用excel与Pandas完成实现数据透视表
数据透视表是一种分类汇总数据的方法。本文章将会介绍如何用Pandas完成数据透视表的制作和常用操作。
可以叫我才哥
2022/11/11
2.4K0
利用excel与Pandas完成实现数据透视表
我的Python分析成长之路9
统计分析是数据分析的重要组成部分,它几乎贯穿整个数据分析的流程。运用统计方法,将定量与定性结合,进行的研究活动叫做统计分析。而pandas是统计分析的重要库。
py3study
2020/02/10
2.3K0
pandas透视表分析
数据透视表是一个用来总结和展示数据的强大工具。pandas提供了pivot_table()函数以快捷地把DataFrame转换为透视表。
陆勤_数据人网
2019/05/28
2.3K0
Python数据透视功能之 pivot_table()介绍
pivot()函数没有数据聚合功能,要想实现此功能,需要调用Pandas包中的第三个顶层函数:pivot_table(),在pandas中的工程位置如下所示:
double
2019/05/28
4.4K0
数据分析之Pandas变形操作总结
pandas 是一个强大的分析结构化数据的工具集;它的使用基础是Numpy(提供高性能的矩阵运算);用于数据挖掘和数据分析,同时也提供数据清洗功能。
Datawhale
2020/07/02
4.1K0
数据分析之Pandas变形操作总结
再见,Excel数据透视表;你好,pd.pivot_table
Excel作为Office常用办公软件之一,其在一名数据分析师的工作日常中也占有一定地位,比如个人就常常倾向于依赖Excel完成简单的数据处理和可视化作图,其中数据处理部分则主要是运用内置函数+数据透视表两大部分。
luanhz
2020/12/17
2.4K0
再见,Excel数据透视表;你好,pd.pivot_table
业界使用最多的Python中Dataframe的重塑变形
可以看到,现在index和columns对应的位置有不同的值。因此,必须确保我们指定的列和行没有重复的数据,才可以用pivot函数
Python编程爱好者
2020/11/30
2.2K0
业界使用最多的Python中Dataframe的重塑变形
对比Excel,轻松搞定Python数据透视表
学习Excel,数据er最常用的两大Excel功能就是VLOOKUP和数据透视表!利用数据透视表可以从繁杂无序的源数据中筛选出自己需要的“字段标题”进行分类汇总、对比或合并等操作,作为一种强大的交互性报表,大大简化了数据处理和分析工作的步骤,提高办公效率,职场达人必学!
快学Python
2022/11/28
1.8K0
对比Excel,轻松搞定Python数据透视表
python数据分析——数据分类汇总与统计
数据分类汇总与统计是指将大量的数据按照不同的分类方式进行整理和归纳,然后对这些数据进行统计分析,以便于更好地了解数据的特点和规律。
鲜于言悠
2024/03/20
1.6K0
python数据分析——数据分类汇总与统计
相关推荐
自动化生成报表
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验