在学习本书前,我想在此夸一夸本书的作者,作者在每一大章的前面都会送读者一段励志话。
临渊羡鱼,不如退而结网。 — 《汉书 董仲舒传》
哲学家柏拉图先生曾经指明,知识的三个条件
从大白话来讲就是知识是人类通过观察学习等行为进而获得总结的产物或者说是集合。
如果我们从不同的研究视角、研究目的以及多知识的不同认识程度对知识进行分类的话,可以分为以下几种:
首先是层次划分
其次是性质划分
最后是来源划分
作者在这总结了一下,无论采用何种划分方式,目的都是为了构建知识实体之间的结构化关系网络的知识图谱,毕竟我们的目的还是搞出知识图谱的。
知识图谱:以结构化的形式描述显示世界中的实体机器关系,将互联网庞大的信息网转化为更接近人类去认知的形式。
这里我仅仅简单概述了一下,想了解更多概念的可以参考百度百科。
知识图谱的相关概念有几个分别是:
我们可以理解为知识图谱就是将世界中的不同的种类的事物连接在一起而得到一个关系网络。
可以从上图看出,实体包括小李,小丁,跑步等,关系包括喜欢,同学等,概念就是人,运动之类的,属性就是面积:3000平方米。整张图还是很好理解的。当然这里面的细节我们也是要知道的。
比如:如果两个节点之间存在关系的话,那么它们之间就会被一条有向边连接在一起。本质来讲:知识图谱就是一种揭示实体之间关系的语义网络,可以对现实世界的事物及其相互关系进行形式化描述。组织形式:有向图
书中在知识图谱分类上分为了两类,一种是通用知识图谱,一种是领域知识图谱
作者还提到,不同的知识图谱并不是一蹴而就的,而是经过漫长的发展和积累进行得到的,这里面包括了前人的不断积累,值得我们去学习与敬佩。
早期阶段:
概念形成(2000年前): 早期的知识图谱概念主要体现在人工智能和语义网等领域。研究者们开始探索如何以图形结构的方式表示和组织知识。
语义网阶段(2001-2010年):
语义网的提出: 在这个阶段,Tim Berners-Lee提出了语义网的概念,强调在互联网上创建具有明确含义的数据链接。RDF(Resource Description Framework)和OWL(Web Ontology Language)等标准被引入,用于表示和推理关于网络资源的知识。
知识图谱概念的兴起(2012年前后):
Google知识图谱: Google于2012年推出了知识图谱,将知识图谱引入主流。这一阶段的重要事件包括谷歌的知识图谱以及百度、微软等公司对知识图谱概念的采纳。
知识图谱的应用拓展(2015年后):
应用扩展: 知识图谱在搜索引擎、虚拟助手、自然语言处理、推荐系统等领域得到广泛应用。各种知识图谱的建设和应用逐渐增多,包括通用知识图谱和领域特定知识图谱。
领域特定知识图谱的兴起(2018年后):
领域特定应用: 随着对于更深入领域知识的需求增加,领域特定知识图谱得到更广泛的应用,如医学知识图谱、金融知识图谱等。
知识图谱与AI的融合(2020年后):
知识增强的AI: 知识图谱与人工智能、机器学习的结合越来越深入。知识图谱被用于丰富机器学习模型的输入,帮助模型更好地理解语境和关系。
这里作者是通过一张图进行展示,并对未来国内对于此行业进行了一定的展望。
从两个角度去看的话,可以分为自底向上和自顶向下 构建知识图谱可以从自底向上和自顶向下两个角度来考虑,这两种方法分别强调从细节逐步构建整体和从整体指导细节的方式。 自底向上(Bottom-Up)的构建方式:
自顶向下(Top-Down)的构建方式:
作者总结到,自顶向下是指为知识图谱定义好本体模型,根据本体模式的约束,再将实体加入知识库。 自底向上是指从一些通用知识图谱中提取出实体,选择其中置信度较高的实体加入知识库,再构建顶层的本体模式。 注意:这里的本体库可以理解为面向对象中的“类”,作者这里形容的十分妙~
逻辑架构可以划分为两个层次:概念层和数据层
概念层的构建是在数据层之上的,这是知识图谱的核心,用来规定知识图片中包含哪些领域的知识、知识的类 别、每种类别知识的关系与属性。
如果从一个例子来展示的话,如下: 概念层:人物1-关系-人物2,人物-属性-属性值 数据层:李娜-丈夫-姜山,李娜-冠军-法网
我相信这样大家理解起来就会轻松许多了吧
本小节内容较多,不进行一一描述,大家可以通过上图进行大概理解知识图谱的整个构建过程。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。