选择往往比单纯的努力更为关键。笔者深感荣幸能踏上自由职业的道路,这不仅赋予了时间的自由,还让笔者得以随心所欲地追求所热爱的事物,学习向往的知识。
作为一名在数据领域深耕十五年的资深从业者,特别是在自由职业的近七年里,笔者接触并掌握了众多数据工具,这些工具已成为构建全方位数据解决方案的得力助手。
在文字表达上,笔者并未过度追求严谨的学术措辞。如果您渴望探寻更严格的数据学说,建议翻阅相关书籍以获得更深入的见解。在这里,笔者将从一位独立数据工作者的视角出发,分享所掌握的数据工具与技能如何为中小微企业带来实际价值。当然,这些见解同样适用于中大型企业中非IT主导的一些部门级别的数据项目。
数据全流程的定义
在笔者看来,企业的日常运营行为转化为数据,进而产生分析价值,反哺企业的数据化精细运营。笔者喜欢将整个数据流程拆解为以下几个阶段:数据生产、采集、处理、清洗、建模、分析可视化、以及报表分发。
数据生产环节
通常,每个企业都有各式各样的业务系统来支撑企业业务的流转,这一点对中小微企业同样适用。这些系统帮助我们在业务的每个节点中规范、合规地运作,产生一条条的数据记录。然而,企业业务的快速变化和业务流程的多样性,使得这些标准化系统难以适应企业需求,强大的系统也难以完全适配。如果能够定制化一些系统功能,帮助业务流转更通畅,则非常有价值。
普通业务系统的功能缺失是一个问题,但笔者认为更糟糕的是:数据的产生过程。在有限的投入成本下,确保数据的规范录入比让人更舒适地录入数据更为重要。因此,你会听到业务人员在使用这些标准化系统时,经常抱怨重复性低效的录入工作。
在数据生产环节,笔者通过Excel的二次开发辅助批量生产数据、使用RPA机器人模拟人工操作业务系统,让大量重复且逻辑性强的数据录入工作由RPA机器人完成。在系统功能缺失的情况下,笔者使用低代码平台如多维表格快速搭建轻量级的小型应用系统(结合RPA和外部API接口技术,可与现有系统进行数据交互联动),大大改善了因现有系统不足引起的不便。
数据采集环节
数据采集通常也属于生产数据的一部分。这些数据并非通过人工一条条从系统中生产出来,而是由外部环境直接提供,可以批量性获取,例如电商行业的商家后台的订单、流量数据等。可以通过下载的方式获取这些数据,还有一些如天气、快递、企业信用、竞品数据等,这些并非内部系统生产的数据,也可以通过数据采集方式获取。
在此环节中,笔者通过RPA技术和网页抓取技术,同样可以将这些外部数据获取下来,与本地企业数据进行更多的整合,为下一步分析做准备。
数据处理与清洗环节
企业通常不缺数据,缺的是数据整合能力。日常运营中产生了大量数据,而这些数据往往不够规范干净,需要进行清洗和处理才能继续使用。即使数据已经存在,但仍分散在各个系统中,形成数据孤岛,难以综合利用。例如,财务数据存在于财务系统中,订单数据存在于业务系统中,人事数据则在另一个系统中。即使是同一数据如订单数据,也因多个渠道分散在多个系统中,如电商的多平台运营。
在此环节中,也是笔者的强项,笔者使用Excel、专业的ETL工具和编程脚本,对数据进行加工处理整合,为下一步数据分析提供高质量完整的数据源。
数据建模与分析可视化环节
在BI领域中,使用维度建模技术可以让原始数据经过建模后,变得更为语义化,易于业务人员驾驭分析。维度建模的好处在于,它允许我们在查看数据时进行数据钻取,从一个粗粒度的数据快速钻取到细分数据,发现问题的细节。同时,对日常分析中的同比、环比、整体与部分占比的分析也变得简单,只需拖拉拽自己想看的维度和指标即可完成分析。
当然,数据分析离不开数据可视化。面对一大串数字,人类的接收度较低,需要借助优秀的可视化技术来展现数据,从而更直观地发现数据反映的问题。
在此环节中,笔者使用PowerBI建模技术,可以将数据整合成一个多维分析模型,供各种前端BI工具调用消费,并且整个过程受权限管控,不同权限的人员看到的数据各不相同,仅能看到自己该看的数据。
在数据可视化环节,笔者更是精通Excel、javascript(Echarts/vega)、python、R等图表制作方式,已开发出标准化商业产品EasyShu图表插件,定制化场景中可快速复用。
『新版发布』EasyShu4.2发布,期盼以久的自动更新功能出炉,插件内一键更新最新版,无需下载安装包
数据报表分发环节
在上一个环节中,我们已经拥有了多维分析数据模型和权限控制,在数据报表分发环节,任务就显得更简单了。特别是使用传统Excel表格的方式进行数据分发时,可以让Excel直接连接到数据模型,即可获取需要的数据。当然还可以使用其他的BI工具来消费数据,或者通过邮件、微信群推送等方式进行分发,这些都可以实现。不过,根据成本需要,不同的方式有不同的成本。
在此环节中,笔者可以充分发挥对Excel、WPS表格的二次开发能力,将数据报表按业务人员所需的样式加工完成。结合RPA和二次开发接口能力,可以让整个流程全自动化起来,最终交付到用户手中的形式可以是邮件PDF文件、微信群推送等现代的移动阅读体验,当然如果是在电脑上查看的方案就更多更简单了。
总结
数据专才与通才,各自独树一帜,而笔者则倾向于后者之道。对于广大的中小微企业而言,仅仅将数据的从0到1的流转环节打通,便能带来不可估量的价值。正是这关键的0到1环节,笔者凭借对Excel二次开发的精通、RPA工具的娴熟运用、低代码平台多维表格的灵活构建以及数据BI报表自动化的技术掌握,得以单独行动,无需繁复的沟通,即可将整个过程以低成本、高效率的方式完美实现。
"数据即是石油",这一口号虽简单,却深藏着时代的真理。笔者坚信,在当下的中小微企业中,若能顺畅无阻地驾驭整个数据链条,便能把握住这个时代赋予的巨大数据红利。
最后,热切期盼,有需求的企业朋友们能向笔者诉说你们的数据需求(下方加我微信),让笔者有幸与你们并肩前行,以低成本、易实施的策略共同实现目标(数据工具千万种,笔者收集到的工具多数是低成本甚至零成本,非常适用于当下大环境下小微企业追求成本节约所需)。
更多笔者的自我介绍和擅长技术领域,可参看下文或点击【阅读原文】查看:https://www.yuque.com/cuihuajihome/document/vku4ac