在8月份里,笔者尝试提交了微软MVP的申请,申请的方向由Excel领域改为数据平台领域,虽然最后没能通过,但得到了美国总部产品组的反馈,得知Excel催化剂在他们眼中也算是一款受欢迎的作品,深感荣幸。反馈原文如下:
尊敬的MVP申请者您好,
首先我们谨代表微软感谢您对MVP奖励计划的关注,借此机会MVP项目组对申请流程及审核后续进行简短的说明:
先前我们已将您的申请提交给美国产品组,得到的反馈是:从MVP奖项分类来看,您的贡献内容主要是Excel方面,这不是目前招募的重点。您的插件很受欢迎,所有贡献基本都是围绕这个插件的项目。根据我们目前的观点,在 Data Platform技术方向没有看到更多贡献。您在 Power BI 和 Azure 上发布了一些文章,这些文章写得很好,但是还需要累积更多来申请奖项。因此在与MVP全球申请者的比对中,产品组最终没有通过您的这次提交。但是您今后还可继续积累贡献,并提交新的申请。
7月MVP项目组刚刚经历了续任审核阶段。微软MVP是最优秀、最富有智慧的社区领袖。这些影响者主要活跃在开发人员和IT专业人员中,他们对技术社区做出贡献,这些贡献是基于他们在过去12个月内所提供的无偿社区贡献,并且这些贡献是由申请者自身创作或者经历参与的,有更高技术影响力的内容
在微软发布一个XLookup简单函数,可以获得社区10万+的关注。
Excel催化剂100+个大功能模块,很大部分已超越Excel自身,衍生到数据科学方法论指引下的智慧结晶之作。
希望优秀的作品,同样可以得到大家的支持与厚爱,多多帮助转发传播一下,让中国独立软件开发者更有尊严地活下去。
功能大模块
在100+的主题功能中,以下将尝试通过几个维度来作简单的梳理,希望能够对初次接触的朋友们可以更加清晰地了解Excel催化剂能够给自己的日常工作带来哪些的便利和帮助。
因现阶段多数功能仅有文字性的教程提供,如感觉教程所讲较为晦涩难懂,可以后续关注Excel催化剂不断追加的视频录制教程,使用视频的方式来学习操作类知识,可以事半功倍,较文字类讲解要清晰不少。
从数据流程的角度进行功能分类
在一个完整的数据分析利用的流程中,有数据生产、数据采集或查询、数据处理及转换、数据建模分析、数据可视化展现、报表生成及分发等环节。
对一般的数据工作者来说,Excel在处理整个数据流程上,都有极大的优势,可以不受制于各个孤立的业务系统的单一的、静态化的、固化不灵活的等缺陷,有很好的改善和补充。
结合Excel催化剂开发的一系列功能增强,让整个数据流程更加地通畅,对数据人员的技能要求、技术水平等降低一大个档次,低门槛地实现数据转换为价值的目标。
一、数据生产环节的支持
有数据是数据分析的最低起点要求,如何生产出有用的并且有分析价值的数据,这就显得很重要。
在中国企业信息化浪潮的20年后的今天,生产数据的环节,看似有各种业务系统的上线来满足到了。但实际上,还存有大量的数据未能有系统的支持来规范化地生产出来,特别是中小企业,也没有那么多的系统厂商可以服务到千变万化的各种业务需求,而就算有,也可能看不上中小企业这样的需求,中小企业也没有太大的意愿去购买一些昂贵的系统,如动辄上千万的SAP等ERP系统。
Excel催化剂提供的数据生产环节的支持,是基于无IT系统的辅助下仍然可以生产出干净规范的数据源,全程只使用OFFICE套件如Word/Excel/Outlook等,其中Excel扮演的角色尤为重要。
这里结合Excel催化剂的功能,做一个简单的数据生产场景的描述。
首先需要制作一个供填报数据的表单,这个过程中,可以充分利用Excel原有的单元格格式设置、函数公式(当然也可以用Excel催化剂开发的大量自定义函数)、工作表保护、工作薄保护、数据有效性验证、条件格式的设定等等。
而Excel催化剂有几个主题性功能,在表单设计上可以有很好的辅助。
二、数据采集或查询环节的支持
现实的工作环境中,往往是有各种系统生产出来数据后,在单一的系统内做数据处理分析不现实,需要将数据导出至Excel表格再加工,同时将多个数据来源的数据进行整合,才能实现数据的利用。
同样不可忽略的是大量的外部数据或手工填报的Excel表单数据存在,这些数据如何能够顺利采集下来供下游的分析使用,也是Excel催化剂花了大量力气去帮助解决的。
在数据采集和数据查询的方面,有如下的一些功能增强辅助。
三、数据处理及转换环节的支持
这个环节,必定是数据分析中重中之重的环节,但往往也是最痛苦的环节,花费大量的时间在其中(80%的时间都不为过),而Excel催化剂所开发的众多功能都是为这个环节来服务,让此环节可以更低门槛、更高效率地开展。
以下同样地罗列下一些重点可关注的功能辅助,大部分有相当大的共性使用场景,小部分会在特定领域上产生作用。
在上述生产数据环节所提及的表单录入,是生产数据不可或缺的方式之一。表单录入后,一般会以一种较松散非结构化的方式存储存数据,而非数据较好利用的结构化的标准数据表单结构。
使用此篇功能,可瞬间对这些数据进行转换,实现此前提仍然需要一些其他额外的功能支持如:
诚如标题所说的,此功能区别于一般插件的功能在于,可以满足更多的不规范的数据源要求。
在系统中导出的零散的Excel表格数据,可使用此篇功能进行合并,最终实现一个表格中包含所有的数据,实现数据源的连续性和完整性。
在多维转一维的需求上,Excel催化剂也区别于一般性插件只是简单转换一个行列结构的交叉表,在此篇所定义的多维不规范数据源中多达5种常见数据源之多,所有这些多维结构数据源,都将被抽象成一定的规则,用一个简单的界面配置即可完成所有的转换。
在传统数据处理中,对非结构化的数据处理通常都较无力,只能投入大量的人工去完成,Excel催化剂引用百度AI技术,通过AI的能力,帮助处理自然语言这样非结构化的数据源,通过【翻译】、【中文分词】、【评论观点提取】、【评论情感分析】等环节,对这些数据进行转换为有分析价值的结构化数据源,供下游分析使用。
承接上一功能提到的非结构化数据结构化处理,还有地理数据方面,将地址信息转换为结构化的省、市、区县等结构化的数据供分析所用。
同样地人工智能技术的应用,将图像化的数据结构化处理,例如常见的身份证、银行卡、驾驶证等证件类信息在图像化存储的方式转换为可供分析使用的结构化数据。
在企业中更大的使用场景的单据类的图像数据,同样可以转换为结构化的数据,减少大量的人工作业时间。
就算从图像转换为文本的通用OCR技术上,也较人手录入的方式要轻松得多,将图像里的文字部分转换为文本数据存储到Excel中,结合Excel催化剂的大量的其他功能辅助,一样可以将其最大限度的自动化方式转换为可供使用分析的结构化数据。
除图像的提取外,还有一个非常大的刚需领域,是将非图像存储方式的pdf文件中的数据提取出来。使用此篇功能,将最大限度地在pdf文件中提取出有价值的信息,供后续其他的数据处理使用。
一般没有科学数据管理方法论的人员,无论是开发者还是普通用户,大量的合并单元格充斥在Excel数据源中,带来无穷无尽的数据处理难题,此篇不止是做数据转换,将合并单元格取消并补充缺失值,更是从科学数据管理方法论的高度阐述了合并单元格的使用场景,做了些理论性的宣导和普及。
笛卡尔积数据结构用得好是天使,用得不好是灾难,许多场景中为了生成穷举所有情形的数据结构时,用上此篇功能,可轻松生成想要的数据结构。
这一数据类型转换的场景,也是非常常见,一个单元格内存储多个并列项目,如爱好:看书、看电影、运动这样的问卷式数据结构,无法进行结构化的分析,需要转换成3行数据,分别有 分书、看电影、运动 三项,才能在后续的分析中分别对这些项目进行统计分析。
有些数据结构,返回的同样为非标准数据表结构,一列内容中混杂了多种指标数据,需要进行透视的展开操作,同样对这样的场景实现了一键完成的简单快捷功能封装。
此功能并非标准数据源结构数据处理中所需要的,但也有很多用户因各种也算是合理的需求下需要做这样的转换操作。
此功能就较为特定场景使用,仅用于父子结构的数据源再处理,将父子结构的数据展开转换为更有可读性和更易使用的数据结构。
同样地这个父子结构的转换,BOM表结构的数据展开,在制造业里非常普遍的需求,就算有SAP这样千万级别的软件支持,也很难说数据开展就尽如人意,让Excel催化剂帮助转换一下制造业的数据根基BOM表,可以让后续的数据分析更加方便。
三、数据建模分析环节的支持
数据不进行分析,躺在系统或电脑里,永远不能产生价值,面对数据化时代的今天,企业已经进入了精细化运营时代,再也没有什么好做的生意了。
若要企业有更强大的核心竞争力,从数据入手,改变过去太多依赖经验拍脑袋的做事方式,尽可能多地让日常企业运营中产生的各种数据作依据,经过数据分析,用数据结论来指导运营,是一条非常值得投入和倡导的路线。
Excel催化剂也尽最大的力量,帮助数据分析岗位的人员可以更低门槛地进行数据分析,更快地产生数据收益。期盼数据分析可以进入广大的中小企业。
近两年在数据分析领域的一匹黑马powerbi工具,它是可以让数据分析无需IT团队的支持,完全由业务分析者主导完成的自助式BI工具。
工具的世界没有完美,大量的场景仍然需要回归到Excel上做分析。Excel催化剂推出了目前来看全球唯一的可打通Excel和PowerbiDeskTop两者交互的功能,让PowerBIDeskTop的数据模型可以在Excel上被引用。
因笔者有从事零售行业的数据分析经验,对零售行业里的搭配率分析有较深的理解,最终以插件的形式,输出搭配率购物篮分析。
让这一在零售行业有普遍共性的分析需求,可以在普通用户群体中只需经过简单的界面配置即可将数据源转换成特定形式,辅助Excel透视表功能即可轻松进行这一普通认为非常复杂高深的分析技术,实现人人都是数据分析师的梦想。
四、数据可视化展现环节的支持
数据最终的展现,让数据结果更易阅读和发现数据价值,可视化环节也是必不可少的。
市面上充斥着大量的可视化的展现,很多时候已经到了一种泛滥的程度,最终变为了炫酷而可视化,已经大大偏离了数据可视化的核心需求。
在Excel催化剂中,不提倡过度可视化,也让可视化环节的制作成本更低,无需经过漫长的学习过程才能上手。尽可能实现一键完成,让更多的时间用在最重要的分析环节上。
同时Excel催化剂也引入了国际性专家级的图表:IBCS规范图表,并且图表以模板的形式提供,更易上手,更专业性地展现数据可视化。
具体在可视化方面着力的功能点有:
使用模板库的方式,让用户更容易复用一些好的图表作品,只需简单更改下数据源,即可完成图表环节的制作。
除了提供了一套图表模板外,用户亦可以自行对自己手中的图表进行扩展,追加到自己的模板库中,使用Excel催化剂图表库功能快速调用这些个人的图表模板。
Excel催化剂以已之力,完成了一个浩瀚的工程,将整套IBCS国际商务沟通标准的专家级图表共27个图表细分类型实现在Excel当中,并且追加了中国特色的需转换万和亿为单位的数据标签需求,非常珍贵的高级图表学习资料和极具使用价值。
整套的IBCS图表模板可轻松复用到实际的数据当中,真正实现了一键制作专业图表的目标。
对文本分析中必不可少的词云图,也将其实现在Excel中,无需频繁切换到不同的应用中去生成词云图,直接从数据到图表,完整地在Excel中得以实现,对需要生成多个平行图表对比分析时,优势尤为明显。
在一般性的可视化中,充分利用Excel的条件格式进行简单可视化,更易发现数据问题,也更易操作,数据表与图的结合更紧密,数据信息量更全面。
在Excel催化剂的封装下,只需一键即可调出,且图表的颜色可自定义为更常用、更专业的图表配色,再加上对极端值的过滤处理,显示更合理。
此功能对原生功能的充分利用的基础上,加上更友好的操作流程和属性配置,堪称插件开发的典范。
五、报表生成及分发环节的支持
一般来说,只要数据源已经转换为标准数据表结构,辅助PowerBI建模技术和Excel透视表操作,基本可满足日常80%以上的常规数据分析。
如果各中小企业都能够达到这样的分析水平,整个企业的数据化运营水平将达到一个非常不错的数据产生价值、数据指导运营的水准了。
Excel催化剂针对其他数据报表的生成需要和数据报表的分发需要,实现了一些十分好用易用,高频需求的功能,具体如下所示:
不同的企业,不同的业务需求和指标分析,需要不同的报表展现方式,所以Excel催化剂花了很大力气,尽可能让报表的生成更加自由化,可以有更大的调整的空间。
其中一种报表暂且叫标签式的报表,应用场景有零售行业的商品分析,对众多的商品款进行畅滞销分析,其中很重要的需求是有图片的结合,进行图文式的分析,力求可以更直观地看到整个商品的各项指标的同时,也能对号入座到是怎样的商品(在商品相似度高,商品款式多的情形下,非常有必要对商品进行图片展示的可视化)。
对这种明细化的数据分析,在Excel上排版制作是再合适不过了。兼顾了灵活性和排版的方便性。使用Excel催化剂的此功能,更是将自动化程度推向高峰,完全地只需简单配置一下,即可自动生成整份数据报表。
上一功能中的报表样式和此功能有本质的区别是,标签式的报表,一条原始数据生成一个单元的报表,而主从结构是多条原始数据生成一份报表,报表是主从结构的(常见的是销售单、发货单、入库单等,表头是单据的一些描述性属性如单据编号、单据日期、制单人等信息,同时附加有多条的商品明细数据,组成一对多的关系)
此功能甚至可以替代许多系统的报表生成工作,对没有现成完整的系统支持的业务或者现有报表样式不太符合要求,想自行重新定义时,不用让系统方重新开发(定制化功能成本极高,一般非常不划算),只需将原始数据整理好,直接在Excel环境中生成最终的报表单据。
在一般的Excel插件里,都会提供拆分工作表这样的功能,但Excel催化剂将这样的功能上升到更科学的方法论上。
不是所有拆分工作表都是有意义,拆分工作表,最终更应该是为了数据分发的简单权限控制的需求上,不能仅仅只是拆分工作表这一动作,拆分完的工作表,最终其他数据报表引用此工作表作数据源时的结构应该保持完好。
即一个完整权限的人拿到一份完整的数据,在制作好数据报表后,仅仅需要将原始数据这个完整的数据源,进行拆分,按不同权限人员能够查看不同的数据,整份数据报表应该仍然带有完整性,数据分发后无需重新做数据分析、输出数据报表的环节,仅需刷新一下数据源,让新的仅有部分权限的用户拿到的数据文件仍然可以复用完整权限者所做的分析报告,仅仅是报告的查看范围受数据源权限限制而已。
报表拆分后,最后的分发环节,可以使用邮件群发功能,不同人发送不同附件,实现权限管理,当然其他用途的数据分发亦可使用邮件发送功能,如表单模板的发送等。同样的邮件发送功能,在第24波里也有实现,若使用Outlook有困难,可以使用无需Outlook的版本。
其他的分类方式来看插件功能
除了从数据流的角度,还有几大零散主题的分类,在此简单做下归类整理。
和文件相关的操作功能
日常电脑使用过程中,离不开对文件、文件夹的操作,在Excel的环境下,除了管理一般性的单元格组成的文本、数字数据,同样可以管理整个硬盘上的文件类数据。
较一般的资料管理器之类的文件操作来说,使用Excel来管理,更能发挥Excel的批量操作的便利性,能够很方便地进行文件的创建、删除、改名、移动、复制等批量性操作。
文件信息中,同样存储了大量的元数据信息,如果将其进行数据表格式的呈现,更加方便对这些文件的分类归档等操作。
在一般性软件只会针对单个文件进行管理,在Excel环境中,非常方便进行批量性的文件管理,如此功能中可将文件的大小、创建日期、修改日期等信息遍历出来,同时更为强大的是对音视频、图像文件特有的重要属性数据如插放时长、音视频格式编码 、图像长宽信息、经纬度信息等信息都可访问。极大地方便了对此类文件的元数据管理。
和图片相关的功能
Excel内插入图片,这样的需求非常旺盛,大量的工作场景中需要,普遍性插件也提供这样的功能,部分插件可能会将其作为收费性的功能卖点。
Excel催化剂在人有我优的理念下,大幅度地改善了批量插入图片这样的常规性需求。
在此功能上,可以将插入的图片完全保留图片的像素不压缩或指定的像素比例,同时可以自定义频繁使用的图片路径以供反复调用。最为核心的是Excel催化剂使用了更为先进的技术,让图片插入到表格中,可以满足后续对图片的放大需求,重新排序需求等,友好度直线提升。
同时也完全做透此功能的需求场景,无论是指定单元格区域放置图片,或是以合并单元格的方式放置,又或者以批注的方式半隐藏的方式放置等等,几乎能够想到的有使用价值的图片放置方式都已经实现了。
很肯定地说,Excel催化剂版的插入图片功能,目前为止是市面上最优秀的功能,远领先其他传统方式的实现。
另一个非常刚需的功能,生成条形码、二维码,一般来说,市面上大量有提供在线网页版的生成功能,但仅仅局限说单个文件的操作,同时生成的图片,其实最终的场景是回到Excel中将其插入到指定的单元格内。
在Excel上实现生成条形码、二维码功能,有许多额外的优势所在如可以轻松批量性生成多个图像,同时图像已经一步到位插入到Excel表格中,使用体验非常友好。
在Excel催化剂中,同样将此功能发挥得淋漓尽致,几乎所有关于条形码、二维码的场景都可轻松地在Excel催化剂内完成。
图片的导入需求有了,同样地导出需求也很旺盛,虽然这不是Excel催化剂所主张的,图片应该以一个图库的形式进行共享,而不应该反复从已经插入到Excel中的图片中再重新提取出来。
但为了满足一些不合规的操作带来的额外功能需求,也将其开发出来,并且在图片导出上进行了更深入的优化,使导出图片过程中更准确可控。
同样地导出功能也可应用在特定的如图表的导出。
自定义函数的扩展
数据处理过程中,大量的数据转换需求,同样地大量的数据再加工过程,以现有的数据为基础,通过一定的逻辑处理,生成新的符合预期需要的数据结果,就是函数的作用。
数据经过函数这个黑箱过程,从一种形式顺利转变为新的形态。
Excel催化剂是极力推荐使用函数功能的,相对于其他查找替换、增删操作,是对数据源带来破坏不可恢复的过程,但函数的操作非常安全,只会新增数据,不会破坏数据。
Excel有几百个函数,远远不够数据处理过程使用,并且许多共性的需求,若仅有原有的函数,非常难以轻松实现预期结果。
要不就是经过大量复杂的函数嵌套,最终可以达到,但复杂过程将大量普通用户拦截在外,不能轻松掌握。
要不就是不可能实现如原生函数没有正则功能,再怎么组合,也没法组合出这样的功能来。
Excel催化剂推崇使用自定义函数进行封装,将复杂的处理过程,最终简单地呈现给终端用户使用。
Excel催化剂实现了多达180+个自定义函数,满足许多复杂的场景使用。
并且使用了特有的动态数组函数的技术(类似Excel365最新技术提供的效果),实现了可以仅需简单输入一个函数,可以返回多个结果值并自动扩展到多个单元格中进行返回。
自定义函数主要细分了以下几大类:
这一系列函数,绝对是高频的函数,可以轻松地访问硬盘上的文件夹文件信息;可以穿透子文件夹遍历所有文件;可以提取文件诸多的元数据如:文件大小、创建日期、修改日期等;可以方便地对文件路径信息进行拆分和拼接如:文件名、后缀名、父文件夹等。
Excel原生功能不支持正则表达式,经过自定义函数的扩展,可以顺利将正则表达式的功能带入到Excel环境中使用,从此在处理各种文本字符串的操作上,带来了极大的便利。
在字符串的世界里,没有正则时,犹如大海捞针,有了正则后,犹如囊中取物。
其他便捷性的操作
相对来说,传统的Excel插件主要是在这一块着手,Excel催化剂也同样地实现了大量有价值的便捷性操作,满足日常工作中的各种繁琐性操作。
简单逻辑以下几点,让大家一同感受一下Excel催化剂下的便利。
在多工作表的工作薄上,快速切换到所需的工作表,提供了任务窗格式的友好访问方式,可快速跳转所需工作表,快速隐藏、显示工作表,工作表排序等操作。
将常用的数字格式预定义好,快速地一键完成数字格式设置,并提供灵活的自定义配置面板,保存配置信息以供日后的复用。
在操作Excel表格过程中,大量的时间用在定位不同的单元格,选择不同单元格区域,使用此功能,可以快速选定所需单元格区域,一次节省不算什么,一辈子的节省就十分可观。同样的辅助单元格快速选择方面还有第63波、第25波都有涉及。
还有大量的便捷操作,不再一一列举,有兴趣的,只需看看标题即可知道功能的实现效果。
结语
优秀从来都来之不易,若你看完此篇导读性文章后,觉得这正是你寻觅已久的工具,不妨动用你一些举手之劳的动作,帮忙将Excel催化剂介绍给更多的人知道,增加一些Excel催化剂的知名度,让优秀的作品得以更多的曝光,让Excel催化剂可以在个人免费的基础上,也有机会触及一些愿意在数据领域进行合作的企业需求,实现双赢。
关于Excel催化剂
Excel催化剂插件使用最新的布署技术,实现一次安装,日后所有更新自动更新完成,无需重复关注更新动态,手动下载安装包重新安装,只需一次安装即可随时保持最新版本!
领取专属 10元无门槛券
私享最新 技术干货