弗格森在《领导力》一书中提到:
盯着数据,就等于是站在病房盯着监护仪上的数字,而病人最后却因为吃三明治噎死了。
大多数人觉得数据分析没用,或者有时会产生副作用。
其实并不是数据分析本身的问题,而是一开始设定的使用方向就产生了错误,从而利用精确的数据分析让这个错误越来越扎实的完成了。
这次《数据运用工作坊》我们就邀请到了菱歌科技创始人栾晔来和我们梳理梳理数据分析的全流程。
在帮我们扫盲的同时,还教会我们如何甄别“正确的数据分析方向”。
01
把时间浪费在不确定因素上
vs
基于确定因素的预测
很多人在数据分析这件事上,还没开始就已经开始犯错了。
首先我们要清晰数据分析和数据预测的边界,也就是说,不是什么事情都可以用数据分析出来的。
每个商业模式背后都有一定比例的确定性因素和不确定性因素。
当不确定性因素超过50%的时候,数据的分析结果就没那么具有参考价值了。
比如你重新在一个新的行业里创业,需要拿出一个别人从来没有做过的商业项目,没有任何过往的数据和经验可以参考。
这时候不确定因素接近90%以上,这类挑战不适合用数据分析的模式来进行预测和支持决策。
当确定性因素高于50%的时候,数据分析就可以起到作用。
比如企业已经经营了5年,积累了企业发展的数据和整个行业发展的数据以及竞争对手的数据。
这个时候可以通过数据分析的来通过以往的发展轨迹预判未来的发展走势。
另外,数据分析更适合研究一个群体的行为,也更容易找出其中的规律;如果要研究一个人的行为轨迹,那就是算命学了。
这就是为什么很多围绕个人的商业模式,比如网红经济和大IP效应,并不受资本市场的欢迎,因为其不可控因素太多,突发事件也很多。
网红可能突然因为失恋而丧失工作的斗志,明星也可能因为突然发生意外而无法继续进行工作。
因此,在开展数据项目之前,就要想清楚,自己要解决的这个挑战,究竟能不能通过数据分析的方式得以解决,究竟对公司的发展是否重要。
避免勤奋的做了一堆无用功,最后还往往得出一些错误的结论。
02
美化自己的观点
vs
验证自己的假设
数据不会说谎,但数据分析会说谎。
工具和方法自身是没有对错的,真正有对错的是背后使用它们的人。
大多数案例都是项目结束要做报告了,为了说服其他人以及漂亮的展示项目成果,就把已有的数据,根据自己拟定的结论,进行断章取义。
看上去数据的确支持了自己的观点,得到了很多可观的产出,实际上因为目的的不纯粹,而导致其分析方法变形,最终的结论根本就立不住脚。
充其量就是创造了一个非常美好的故事,骗过别人也骗过自己,最终成为企业当中的垃圾流量信息之一。
当垃圾流量信息的量高于有效信息时,整个企业的效率和发展趋势就会飞速下降。
数据项目实际上属于认知科学,其初衷就在于验证自己提出的一个认知假设,要确定采集的数据以及使用的分析方法。
一个数据项目80%的工作其实在项目开始之前就完成了,因此数据思维实际上就是一个全局思维,要从全盘角度来看待和分析,这样得出的结论才能创造新的价值。
你是希望企业里有一个得过且过应付当下安于现状的团队呢,还是希望收获一个一丝不苟严谨可靠着眼未来的团队呢?
03
大海捞针vs定向捕捞
很多企业有数据,但是没有数据分析。
他们会把数据整理好放在一个地方,然后这些数据就在那里一直放着吃灰,也没人去整理也没人去使用。
无论线上还是线下,放东西都是需要空间的,久而久之这堆数据反而成了占地方的垃圾了。
而企业最常见也最偷懒的做法,把这堆数据垃圾扔到数据分析师面前,说道,我也不知道这堆数据有什么用,你帮我整理整理分析分析吧。
一个数据项目要完成需要五个步骤,分别是采集数据,处理数据,分析数据,数据预测,进行决策。
数据分析师的确精通技术和方法,但他并不懂行业,也不懂企业,这里面除了分析数据可以外包以外,其他的其实都要靠企业自己来完成。
如果单纯的把数据全给数据分析师,这就好比,给了他一整个图书馆。
就算翻遍整个图书馆的书,也不可能知道你心里想要的书是什么,想要的结论又是什么,毫无相关的数据之间毫无规律可言。
所以我们要做的就是将数据简单分类,定向捕捞。
数据可以分为三类:
假如把数据比作咖啡豆,那描述性数据就是一堆处理过的咖啡豆;
预测性数据就是手冲咖啡,找到其中的规律和趋势;
规则性数据就是用最佳模型制作咖啡机冲出来的咖啡。
在描述性数据当中筛选出用于预测的数据,然后形成一系列预测性数据。
在预测性数据当中发现和分析出规律,形成新的数据规则,用这套模式去自动采集数据得出结论。
当然,做完这些以后,还有一个重头戏,就是认真鉴别真正无用的数据,进行数据断舍离。
让这些垃圾数据不再扰乱视线,数据只有真正做了瘦身才能支持企业高效运营。
04
花里胡哨vs简单清晰
很多人做数据图,都觉得要酷炫,要好看,要让在场看到这图的人都心生赞叹,然后操作的方向就变形了。
明明可以平面柱状图就说清楚的数据,偏要搞个立体柱状图。
明明只有两个变量用两个颜色表示清楚就行,偏要用七个颜色。
数据图的初衷还是为了能让观看的人最快最直接就能看清里面要表达的信息。
假如用最简单的颜色和最简单的图形就能表达清晰,去过分包装修饰就是画蛇添足。
工欲善其事,必先利其器。工作坊中还邀请了菱歌科技的一位资深数据分析师来教大家现场使用数据分析工具tableau的使用方法。
这样大家只需要采集数据和处理数据之后放到软件当中,就可以高效简单的生成各种分析内容以及分析图表。
而且还会将相同的数据进行关联,也可以生成线性回归线来寻找数据背后的规律。
以往我们在不懂得使用数据工具的情况下,通常要在数据图表的制作和分析上花费大量的时间,还容易犯以上说的那些错误。
有了工具以后,我们就再也不用在图表制作上耗费没有意义的时间了,而将更多的精力用于梳理整个数据项目,找出真正值得解决的问题。
其实归根结底,整个工作坊就说了一件事儿,那就是数据分析真的是一个关乎整个公司的巨大工程。
每一步都需要很多人的参与和配合,并不是单纯的技术或者图表这么简单。
如果要启动这项大工程,就一定要思考清楚,这个问题值不值得花这么多时间和精力来解决。
它是否能为企业的成长真正提供价值,是否能形成企业经久不衰的王牌算法,让企业在这个大数据时代活得更好,创造更多价值。
比结果更重要的是,企业的每一个人是否愿意成为数据科学家,掌握新商业时代的数据思维语言,形成有数据说数据,没有数据说经验的协作能力?
能够更加系统化全面化的去发现问题分析问题,让数据真正成为每个人成长道路上的宝藏,那这个工作坊就物超所值了。
领取专属 10元无门槛券
私享最新 技术干货