首页
学习
活动
专区
工具
TVP
发布
技术百科首页 >数据清洗 >数据清洗需要清洗哪些数据?

数据清洗需要清洗哪些数据?

词条归属:数据清洗

数据清洗需要清洗以下几类数据:

缺失值

缺失值是指数据中缺少某个值或者某些值的情况,需要对缺失值进行处理,可以填充缺失值或者删除缺失值所在的行或列。

重复值

重复值是指数据中存在重复的记录或数据,需要对重复值进行处理,可以删除重复值或者合并重复值所在的行或列。

异常值

异常值是指数据中存在明显错误或不符合规律的值,需要对异常值进行处理,可以删除异常值或者进行修正。

数据格式

数据格式是指数据的命名格式、日期格式、数据类型、单位等,需要对数据格式进行处理,使其更加一致和易于比较和分析。

数据范围

数据范围是指数据的最大值和最小值,需要对数据范围进行处理,使其符合实际情况和业务需求。

数据精度

数据精度是指数据的小数位数或者有效数字位数,需要对数据精度进行处理,使其符合实际情况和业务需求。

数据类型

数据类型是指数据的类型和格式,需要对数据类型进行处理,使其符合实际情况和业务需求。

数据单位

数据单位是指数据的单位和量纲,需要对数据单位进行处理,使其符合实际情况和业务需求。

相关文章
数据清洗
逻辑性检测是指数据的各个字段中的值是否存在矛盾,比如在地址信息中,如果有一条要素省市区各字段值分别为:河南省郑州市西湖区。那么这条要素中的各个值之间就矛盾了!郑州市没有西湖区!
数据处理与分析
2019-07-31
1.7K0
数据清洗 Chapter01 | 数据清洗概况
这篇文章讲述的是数据存储方式和数据类型等基本概念、数据清洗的必要性和质量评价的关键点。希望这篇数据清洗的文章对您有所帮助!如果您有想学习的知识或建议,可以给作者留言~
不温卜火
2020-10-28
1.7K0
python数据清洗
数据的质量直接关乎最后数据分析出来的结果,如果数据有错误,在计算和统计后,结果也会有误。 所以在进行数据分析前,我们必须对数据进行清洗。需要考虑数据是否需要修改、如何修改调整才能适用于之后的计算和分析等。
Python疯子
2018-09-06
2.5K0
pandas数据清洗详细教程_excel数据清洗工具
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
全栈程序员站长
2022-10-04
1K0
7步搞定数据清洗-Python数据清洗指南
作者:KOALA https://zhuanlan.zhihu.com/p/60241672
统计学家
2019-07-22
4.5K0
点击加载更多
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
领券