首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Excel文本数据的处理,这些方法会让你一见钟情!

本系列内容旨在介绍Excel2016以上版本的一个重点功能(Power Query,简称PQ),以达到的效果;要看往期内容的朋友,可以在文末点我头像进行查看。

文本数据的清洗处理,相对纯数字来说是比较复杂的!现在Excel工作表中,专门的文本类函数也有近40个,可谓相当丰富了!

Excel工作表的文本函数(Microsoft 365)

那么号称数据清洗利器的Power Query,它的文本处理能力又如何呢?本期我们就来入门学习『文本列』的操作功能,初探PQ的文本处理实力!

转换 文本列

大家也可以看到『文本列』下的功能,基本上每个小功能都有下拉箭头,表示会存在更多的处理情况。以下将会逐一介绍:

拆分列

拆分列

对于文本处理来说,拆分列是一个非常调频的操作,所以我们之前在【主页】菜单中也见过它,在前面的内容中也已有过一些介绍。

最普通的分列

在PQ的拆分列功能中,相对于Excel工作表的分列,最大的区别就是:

PQ中可选仅左1或右1的分隔符生效,当我们只需要最左边、或最右边的文本时,这个就相当人性化了

PQ中可轻松实现【数字】【非数字】的拆分,即中文和数字的拆分将会相当方便!

PQ中可实现分拆到行的功能,这个在某些特殊情况下,将会非常高效。(如下图)

强大的拆分到行功能

格式

调整文本格式这里的功能都非常好理解,都是字面的意思理解即可

格式

大写,就是把文本中全部英文字母变成大写的

小写,就是把文本中全部英文字母变成小写的

首字母大写,就是把文本中全部英文单词的首字母变成大写的,其余字母为小写

修整,就是指清空整个文本的首尾空格

清除,就是指清空文本中的非打印字符,常见如换行、回车等

添加前缀,指在文本前添加一些字符

添加后缀,指在文本后添加一些字符

合并演示如下:

提取

关于文本的提取,你可以想像类似于Excel工作表的left,right,mid这些,当然PQ这里会更加丰富,更加强大!

提取

长度,就是计算文本的字符数

首字符,就是相当于Excel工作表里的Left函数,从左边取一定长度的字符

结尾字符,就是相当于Excel工作表里的Right函数,从右边取一定长度的字符

范围,就是相当于Excel工作表里的Mid函数,从某个位置开始,取一定长度的字符

分隔符之前的文本,就是指取某个分隔符之的字符串

分隔符之后的文本,就是指取某个分隔符之的字符串

分隔符之间的文本,就是指取某2个分隔符之的字符串

合并演示如下:

提取文本

合并列

这是最简单的操作了,只需要选中你要合并的列(),然后再点“合并列”,即可实现类似Excel工作表中&的效果,但PQ这里只是纯点击操作非常方便,即使你有多列也可一键合并!

合并列

分析

分析这个功能,日常数据分析中一般用得不多,主要用来解析XML、JSON的字符串使用的,作用是把半结构化的数据转成结构化的数据。

分析

以下是一个xml文本数据的解析示范:

总结

如果你跟着这几期的PQ入门知识学习,不知道你有没有感觉:其实只要你在Excel工作表方面的基础扎实,转到PQ中使用其实是相当轻松的,因为工作表里能实现的数据清洗功能,PQ也是可以实现的,而且大多数功能都更便捷了,更强大了!(而且Excel工作表的文本函数,可能要通过各种嵌套才能实现某些功能,提升了数据清洗的难度)

所以从数据清洗方面的功能来去比较Excel传统工作表功能 VS Power Query,当然是PQ要胜出了!所以如果你是经常要做数据分析的,PQ可以说是必学的技能!

好,本期的内容就到这里,预计大家花约半小时实操一下,即可完全掌握~如果你觉得本期的文章对你有帮助,可以点个赞喔~

---线下学习推荐---

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20200919A0HBBM00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券