我们不生产数字,我们是数字的搬运工”。
这句话是好多在财务分析岗位或者从事数据分析类工作者的一个真实写照。
试想一下,你有多少时间在做真正的分析?又有多少时间在处理那些繁琐的基础数据?
不论你是何种Excel用户,你可能经常做如下的事务:
数据获取:从不同来源,不同结构,不同形式获取数据并按统一格式进行横向合并,纵向(追加)合并,条件合并等。
数据转换:将原始数据转换成期望的结构或格式。
数据处理:为了后续分析的需要进行数据预处理,例如:加入新列、新行、处理某些单元格值。
我们处理数据的获取、转换、处理最常见的方法有三种:Excel公式、VBA编程、SQL数据库。
而PowerQuery是微软推出的一整套Power工具-系列的一个组成成员,是在Excel平台控制及转换数据的最佳工具,它是以查询为主题而存在的。
它对数据的处理不同于上面的三个方法,它既不是公式也不是一门语言,它是一个工具插件,这个插件把我们常用的提取、清洗、加载数据等常用功能制作成了傻瓜化的界面,让不懂高级计算机语言的人也能够非常快速地完成数据处理工作。
在Excel2016版本已经集成了PowerQuery的插件功能,在就可以找到这个模块,而在Excel2010和2013版本需要单独安装插件,插件的免费下载大家可以百度"Power Query"很容易搜到。当然PowerBI软件集成了PowerQuery的功能。
大多数数据分析师都是在用80%的时间做基础的数据处理工作,而用不到20%的时间做数据分析,也就是说,他们的大部分时间都是在做附加值低的工作。那么如何减少这种附加值低的工作,从而提高工作效率呢?
答案是借助工具的力量。
所以,我们需要借助一个外物——强大的Power Query工具,来解决这个工作时间分配失衡的问题,打造一个工作新常态:用20%的时间做数据处理工作,用80%的时间做数据分析工作。
PowerQuery的优势与短板
优势
函数之间相互独立,类似于EXCEL函数,无需底层理论,甚至不需要掌握Excel函数就能快速上手,即学即用。
700多个函数提供了丰富的功能。
相比Excel函数,性能更强大,轻松处理大量数据,告别卡顿。
作为一款轻量ETL工具:清洗步骤可视化、可修改、可复用。极大简化工作时间,从函数和VBA中把Excel用户解放出来。Excel用户掌握PQ,可以大幅度减轻工作量,PQ程序化的解决了许多EXCEL函数的复杂问题,相当于内置了一个帮你处理的数据的超级VBA程序
掌握面板功能可以胜任80%的任务,对于一般用户足矣,学习曲线相对容易。
Excel 2016的VBA程序支持使用M函数,两者可以强强联合,尝试更多可能。没有额外的收费
短板
M函数严格区分大小写,目前没有智能提示,书写不方便。
某些自定义操作可能显著降低执行效率,例如通过定义相邻行进行后续计算的语句。
M语句没有可以调优的工具,无法知晓公式引擎的内部运行原理。
受引擎性能的局限,不适合处理企业级数据。
多个查询互相引用,刷新时每个查询都会重新计算。需要使用Buffer函数把重复执行的查询缓存起来,起到提升效率的目的。但如果连接的是数据库,优先保证Query Folding,此方法不适用。
目前看来PQ是Excel用户的玩具,微软没有打算把它升级为企业级工具。
领取专属 10元无门槛券
私享最新 技术干货