在大数据时代,数据,信息,知识都是常被提及的词语。DIKW金字塔(Data, Information, Knowledge, Wisdom)在80年代就被提出来了。然而,数据、信息、知识、智慧的关系到今天依然没有理清。撇开智慧不谈(大概是通用人工智能的层级),本文主要厘清一下数据、信息、知识的关系。
今天,学术界和业界大谈数据管理,数据分析,信息管理,知识工程,知识管理。在业界,数据、信息、知识许多时候表示的是同一个意思;在学术界,学者们努力区分数据、信息、知识,然而尚未达成共识。虽然所有人都可以隐约感觉到这三个概念之中的区别。根据DAMA-BOK,数据,信息,知识的定义如下:
数据是以文本、数字、图形、图像、声音和视频等格式对事实进行表现。
信息是指有上下文的数据。上下文包括:(1)数据元素和相关术语的业务含义;(2)数据表达的格式;(3)数据所处的时间范围;(4)数据与特定用法的相关性。我们作为消费者不断解释数据,从而创造出信息。
知识是对情境的理解、意识、认识、识别,以及对其复杂性的把握。知识是基于某一角度的信息整合形成的一种观点。这种观点是基于对模式(例如由其他信息和经验形成的趋势)的承认和解释。知识还可能包括假设和有关推理的力量。知识可以是显示的,也可以是隐式的。当我们认识到信息的意义时,我们就获得了知识。
举个例子,网购中一个消费者购买了件1000元的商品。在市场部人员看来,1000元是数据,表示了购买金额的实事;消费者购买1000元这件事(包括时间、具体商品等)是信息,包含了1000元购买产生的上下文;而购买1000元的客户最终被归结为高价值客户,这是知识,包含了对情境的理解。我们发现,越高的层级就越抽象,层级的界限就越难厘清。我们不考虑哲学层面的区分(往往涉及到认识论),从企业实践角度关注数据,信息,知识之间的区别:
数据与信息的关键区别在于上下文情境;
信息与知识关键区别在于可操作性。
区分了数据、信息、知识后,有啥好处?厘清概念最大的好处在于作为讨论和交流的基础,和对事物分而治之的深入认识。在此基础上,我们可以理解企业之中的数据管理,信息管理和知识管理。
数据管理是信息管理和知识管理的基础。其要点在于,数据范围规定,数据质量维护,数据安全管理,数据系统构建。
信息管理帮助信息消费者解释数据。其要点在于,让人能够接触到有价值的上下文,增加信息的可得性,从而增强信息消费者的理解。
知识管理的要点在于可操作性。知识可以是显性的(在机器中)和隐性的(在人脑中)。在通用人工智能出现之前,不是所有隐性知识都能被转化为显性知识。因此,在人工智能时代,知识管理的要点在于,第一,尽可能将隐性知识转化为显性知识。例如,当前很多金融领域通过NLP技术,用机器对财报和新闻进行初步理解,将结果呈现给使用者,即是将从前需要人通过阅读完成的简单知识工作的自动化;第二,尽可能促进隐性知识的交流,即增强人与人之间的交流,例如AR技术可使学习者身临其境。
未来,企业将会越来越重视数据,信息,知识与其管理。
领取专属 10元无门槛券
私享最新 技术干货