前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >利用Python进行数据分析(14) pandas基础: 数据转换

利用Python进行数据分析(14) pandas基础: 数据转换

作者头像
公众号---人生代码
发布于 2019-10-23 11:39:57
发布于 2019-10-23 11:39:57
5720
举报
文章被收录于专栏:人生代码人生代码

1. 移除重复数据

DataFrame里经常会出现重复行,DataFrame提供一个duplicated()方法检测各行是否重复,另一个drop_duplicates()方法用于丢弃重复行:

duplicated()和drop_duplicates()方法默认判断全部列,如果不想这样,传入列的集合作为参数可以指定按列判断,例如:

duplicated()和drop_duplicates()方法默认保留第一个出现的值,传入take_last=True保留最后一个值:

2.利用映射进行数据转换

3.DataFrame的povit方法

虽然这种存储格式对于关系型数据库是好的,不仅保持了关系完整性还提供了方便的查询支持。但是对于数据操作可能就不那么方便了,DataFrame的数据格式才更加方便。DataFrame的pivot方法提供了这个转换,例如:

使用函数也能达到同样的效果:

4.替换值

replace()方法用于替换:

一次替换多个值:

对不同的值进行不同的替换:

5.DataFrame重命名轴索引

重命名列:

重命名索引:

6.将数据分成不同的组

7.检测和过滤异常值

假设你有一组数据:

找出绝对值大于2的值:

找出绝对值大于2的行:

将异常值设置为0:

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-10-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 CryptoCode 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Python数据分析之数据预处理(数据清洗、数据合并、数据重塑、数据转换)学习笔记
参考链接: Python | pandas 合并merge,联接join和级联concat
用户7886150
2020/12/26
6.1K0
数据清洗与准备(2)
有时候我们并不是想要过滤缺失值,而是需要补全数据。大多数情况下,主要使用fillna方法补全缺失值,调用该方法时,可以传入一个常数来替代缺失值。
python数据可视化之路
2023/02/23
6980
数据清洗与准备(2)
《利用Python进行数据分析·第2版》第7章 数据清洗和准备7.1 处理缺失数据7.2 数据转换7.3 字符串操作7.4 总结
在数据分析和建模的过程中,相当多的时间要用在数据准备上:加载、清理、转换以及重塑。这些工作会占到分析师时间的80%或更多。有时,存储在文件和数据库中的数据的格式不适合某个特定的任务。许多研究者都选择使用通用编程语言(如Python、Perl、R或Java)或UNIX文本处理工具(如sed或awk)对数据格式进行专门处理。幸运的是,pandas和内置的Python标准库提供了一组高级的、灵活的、快速的工具,可以让你轻松地将数据规变为想要的格式。 如果你发现了一种本书或pandas库中没有的数据操作方式,请尽管
SeanCheney
2018/04/24
5.5K0
《利用Python进行数据分析·第2版》第7章 数据清洗和准备7.1 处理缺失数据7.2 数据转换7.3 字符串操作7.4 总结
数据分析索引总结(下)Pandas索引技巧
给index传入的字典,键是原来的索引值, 值是新的索引值。无需指定要修改的索引级别,会自动寻找索引中的相应的值----当不同层级的索引有相同的值的时候,这会造成混乱。
Datawhale
2020/06/04
3K0
pandas进行数据分析
懂编程语言最开始是属于程序猿的世界,现在随着国内人们受教育程度的提升、互联网科技的发展,业务人员也开始慢慢需要懂编程语言。从最近几年的招聘需求看,要求会Python则成为刚需。
花落花相惜
2021/11/26
1.5K0
50个超强的Pandas操作 !!
首先给出一个示例数据,是一些用户的账号信息,基于这些数据,这里给出最常用,最重要的50个案例。
JOYCE_Leo16
2024/03/22
1.1K0
超全的pandas数据分析常用函数总结:上篇
基础知识在数据分析中就像是九阳神功,熟练的掌握,加以运用,就可以练就深厚的内力,成为绝顶高手自然不在话下!
朱小五
2020/04/02
3.8K0
Pandas必会的方法汇总,数据分析必备!
用Python做数据分析光是掌握numpy和matplotlib可不够,Pandas是必须要掌握的一个重点,numpy虽然能够帮我们处理处理数值型数据,但是这还不够,很多时候,我们的数据除了数值之外,还有字符串,还有时间序列等,比如:我们通过爬虫获取到了存储在数据库中的数据。
小F
2021/09/14
6.4K0
python pandas 基础之四---转换,排序,聚合
duplicated()函数可以检测重复的行,返回布尔型的Series对象,每个元素对应一行。
小末快跑
2019/07/03
8490
数据分析之pandas模块
  类似于一位数组的对象,第一个参数为数据,第二个参数为索引(索引可以不指定,就默认用隐式索引)
py3study
2020/01/17
1.2K0
Python开发之Pandas的使用
==值得注意的是,drop函数不会修改原数据,如果想直接对原数据进行修改的话,可以选择添加参数inplace = True或用原变量名重新赋值替换。==
MiChong
2020/09/24
3.1K0
使用Pandas进行数据清理的入门示例
数据清理是数据分析过程中的关键步骤,它涉及识别缺失值、重复行、异常值和不正确的数据类型。获得干净可靠的数据对于准确的分析和建模非常重要。
deephub
2023/08/30
4230
使用Pandas进行数据清理的入门示例
Pandas数据分析
我们使用read读取数据集时,可以先通过info 方法了解不同字段的条目数量,数据类型,是否缺失及内存占用情况
@小森
2024/03/15
3740
Pandas数据分析
Python之数据规整化:清理、转换、合并、重塑
Python之数据规整化:清理、转换、合并、重塑 1. 合并数据集 pandas.merge可根据一个或者多个不同DataFrame中的行连接起来。 pandas.concat可以沿着一条轴将多个对象
王小雷
2018/01/02
3.4K0
python数据分析笔记——数据加载与整理
Python数据分析——数据加载与整理 总第47篇 ▼ (本文框架) 数据加载 导入文本数据 1、导入文本格式数据(CSV)的方法: 方法一:使用pd.read_csv(),默认打开csv文件。 9、
张俊红
2018/04/11
6.4K0
python数据分析笔记——数据加载与整理
python数据科学系列:pandas入门详细教程
前2篇分别系统性介绍了numpy和matplotlib的入门基本知识,今天本文自然是要对pandas进行入门详细介绍,通过本文你将系统性了解pandas为何会有数据分析界"瑞士军刀"的盛誉。
luanhz
2020/05/14
18.7K0
软件测试|数据处理神器pandas教程(十五)
在数据处理和分析中,重复数据是一个常见的问题。为了确保数据的准确性和一致性,我们需要对数据进行去重操作。Pandas提供了一个功能强大的去重函数——drop_duplicates(),它可以帮助我们轻松地处理数据中的重复值。本文将详细介绍drop_duplicates()函数的用法和应用场景。
霍格沃兹测试开发Muller老师
2023/08/20
2610
盘点66个Pandas函数,轻松搞定“数据清洗”!
之前黄同学曾经总结过一些Pandas函数,主要是针对字符串进行一系列的操作。在此基础上我又扩展了几倍,全文较长,建议先收藏。
朱小五
2022/04/11
4.1K0
盘点66个Pandas函数,轻松搞定“数据清洗”!
【无痛学Python】Pandas数据载入与预处理,看这一篇就够了!
对于数据分析而言,数据大部分来源于外部数据,例如CSV文件、Excel文件以及数据库文件等等。
Skrrapper
2025/06/10
1680
数据分析与数据挖掘 - 07数据处理
Pandas是数据处理中非常常用的一个库,是数据分析师、AI的工程师们必用的一个库,对这个库是否能够熟练的应用,直接关系到我们是否能够把数据处理成我们想要的样子。Pandas是基于NumPy构建的,让以NumPy为中心的应用变得更加的简单,它专注于数据处理,这个库可以帮助数据分析、数据挖掘、算法等工程师岗位的人员轻松快速的解决处理预处理的问题。比如说数据类型的转换,缺失值的处理、描述性统计分析、数据汇总等等功能。 它不仅仅包含各种数据处理的方法,也包含了从多种数据源中读取数据的方法,比如Excel、CSV等,这些我们后边会讲到,让我们首先从Pandas的数据类型开始学起。 Pandas一共包含了两种数据类型,分别是Series和DataFrame,我们先来学习一下Series类型。 Series类型就类似于一维数组对象,它是由一组数据以及一组与之相关的数据索引组成的,代码示例如下:
马一特
2020/09/24
2.8K0
数据分析与数据挖掘 - 07数据处理
推荐阅读
相关推荐
Python数据分析之数据预处理(数据清洗、数据合并、数据重塑、数据转换)学习笔记
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档