本系列内容旨在介绍Excel2016以上版本的一个重点功能(Power Query,简称PQ),以达到的效果;要看往期内容的朋友,可以在文末点我头像进行查看。
文本数据的清洗处理,相对纯数字来说是比较复杂的!现在Excel工作表中,专门的文本类函数也有近40个,可谓相当丰富了!
Excel工作表的文本函数(Microsoft 365)
那么号称数据清洗利器的Power Query,它的文本处理能力又如何呢?本期我们就来入门学习『文本列』的操作功能,初探PQ的文本处理实力!
转换 文本列
大家也可以看到『文本列』下的功能,基本上每个小功能都有下拉箭头,表示会存在更多的处理情况。以下将会逐一介绍:
拆分列
拆分列
对于文本处理来说,拆分列是一个非常调频的操作,所以我们之前在【主页】菜单中也见过它,在前面的内容中也已有过一些介绍。
最普通的分列
在PQ的拆分列功能中,相对于Excel工作表的分列,最大的区别就是:
PQ中可选仅左1或右1的分隔符生效,当我们只需要最左边、或最右边的文本时,这个就相当人性化了
PQ中可轻松实现【数字】【非数字】的拆分,即中文和数字的拆分将会相当方便!
PQ中可实现分拆到行的功能,这个在某些特殊情况下,将会非常高效。(如下图)
强大的拆分到行功能
格式
调整文本格式这里的功能都非常好理解,都是字面的意思理解即可
格式
大写,就是把文本中全部英文字母变成大写的
小写,就是把文本中全部英文字母变成小写的
首字母大写,就是把文本中全部英文单词的首字母变成大写的,其余字母为小写
修整,就是指清空整个文本的首尾空格
清除,就是指清空文本中的非打印字符,常见如换行、回车等
添加前缀,指在文本前添加一些字符
添加后缀,指在文本后添加一些字符
合并演示如下:
提取
关于文本的提取,你可以想像类似于Excel工作表的left,right,mid这些,当然PQ这里会更加丰富,更加强大!
提取
长度,就是计算文本的字符数
首字符,就是相当于Excel工作表里的Left函数,从左边取一定长度的字符
结尾字符,就是相当于Excel工作表里的Right函数,从右边取一定长度的字符
范围,就是相当于Excel工作表里的Mid函数,从某个位置开始,取一定长度的字符
分隔符之前的文本,就是指取某个分隔符之前的字符串
分隔符之后的文本,就是指取某个分隔符之后的字符串
分隔符之间的文本,就是指取某2个分隔符之间的字符串
合并演示如下:
提取文本
合并列
这是最简单的操作了,只需要选中你要合并的列(),然后再点“合并列”,即可实现类似Excel工作表中&的效果,但PQ这里只是纯点击操作非常方便,即使你有多列也可一键合并!
合并列
分析
分析这个功能,日常数据分析中一般用得不多,主要用来解析XML、JSON的字符串使用的,作用是把半结构化的数据转成结构化的数据。
分析
以下是一个xml文本数据的解析示范:
总结
如果你跟着这几期的PQ入门知识学习,不知道你有没有感觉:其实只要你在Excel工作表方面的基础扎实,转到PQ中使用其实是相当轻松的,因为工作表里能实现的数据清洗功能,PQ也是可以实现的,而且大多数功能都更便捷了,更强大了!(而且Excel工作表的文本函数,可能要通过各种嵌套才能实现某些功能,提升了数据清洗的难度)
所以从数据清洗方面的功能来去比较Excel传统工作表功能 VS Power Query,当然是PQ要胜出了!所以如果你是经常要做数据分析的,PQ可以说是必学的技能!
好,本期的内容就到这里,预计大家花约半小时实操一下,即可完全掌握~如果你觉得本期的文章对你有帮助,可以点个赞喔~
---线下学习推荐---
领取专属 10元无门槛券
私享最新 技术干货