数据土壤是否足够肥沃,取决于数据的广度、深度、精度、长度和新鲜度,肥沃的土壤就像亚马逊丛林,滋养万物。
数据价值取决于应用。数据不是越多越好,就跟油田一样,光有油没用,得把油挖出来,这就需要去探查油田的内部结构,去建设好的数据体系,让数据易于获得、应用,且成本最小化。
一项关键数据的价值顶过一堆数据堆砌,数据应用的话题下次讨论。
今天先讨论什么决定了数据的油品,数据的广度、深度、精度、新鲜度、长度决定了数据的基础价值。
以一辆车为例来说明他们的含义。
1
广度指数据覆盖面,尤其关键信息应有尽有。以车为例,一辆车就是一个ID,尤其关键信息都要有,如:
•车型:如品牌、型号、配置
•销售记录:如销售时间、价格
•保养记录:保养时间&内容
•使用记录:如里程、维修记录
•保险记录:出险记录
•……
2
深度是指数据所触达的程度,以车的使用记录为例,深度数据需要包含下面的信息:
•行驶总公里数
•日常行车路线、路况
•维修次数
•维修内容
•维修点
•……
比如说这辆车维修过3次,和这辆车在4S店维修过3次,这两个信息的价值就完全不一样。
3
精度指单一指标的精准度,越精准就越明确,无论是分析还是产品化的价值就更显性化,反之,指标越模糊,分析、产品化的价值就要打折,难度也加大。
以一辆车的车价为例,不同精度的表达方式:
•大区间描述:售价车价在10-20万之间
•模糊区间描述:车价在15-20万之间
•精准描述:车价为18.8万
有了精准的车价,无论是面向消费者的提供购车、转让信息查询,还是面向汽车服务机构的车辆估值、授信评判都极为重要,不但信息可用了,也会极大提高人效。
4
数据的新鲜度就跟家庭买菜一样,新鲜的蔬菜营养价值总会更好,清晨刚从菜地里采摘下来的蔬果,更为新鲜爽口,更受家庭青睐。很多家庭不会吃上周的蔬菜,因为菜可能已经蔫了、坏了。
对于数据来说,它的新鲜度体现在:
•数据的更新时效:每天更新、每周更新、每月更新。比如双11淘宝成交的数据大屏都是实时数据。放在古代,数据、信息传递都要通过驿站、快马来实现。随着现代技术的越来越发达,信息扁平化、实时化,决策也越来高效
•数据的时效:数据的时效体现在今天看到是今天、昨天、还是前天,或者上周的数据,即使每天更新的数据,也未必是最新鲜的数据。
数据的更新机制,背后往往是系统的工作机制、数据对接的机制。
5
数据长度,也就是拥有多长时间周期的数据,一天、一周、一个月、一年、五年还是十年。
不是所有数据都需要长周期,但需要满足基本的经营观察周期的数据,如同比、环比。部分有特定需求的数据,比如实验室的个体跟踪数据,就需要长周期,经济大周期也需要长周期,几十年甚至上百年的数据。