知识图谱是帮助计算机智能理解文字语义的一项关键技术。它以一种机器可计算的形式化方法,表示和存储人类的经验知识,并将它们与各种文本进行匹配,开展推理。通常可以将知识图谱视为一张图,图中每一个顶点表示一个目标,每一条边表示目标之间的关系。在大量的应用领域中,知识图谱是用来打造行业智能的一项基础。
知识图谱技术的功能强大,使得它在企业服务的场景中有着不少应用,可以满足下面一些不同层次难度的常见需求:
信息检索:当需要从海量的文档中检索目标时,可以在检索结果中显示结果文档包含的一些关键目标以及它们之间的关系。例如,知识图谱可以帮助在检索结果中同时显示与返回文档中所含人物相关的其他人物或机构,这是常见的搜索功能。
客服问答:当需要基于一个已有的“问题-答案”列表来回答新的问题时,需要计算与新问题最近似的已有问题,并返回该问题的答案。知识图谱常用来辅助定义该问题领域的一些关键概念以及词语之间的同义关系,以改进对答案的检索效果。
行业知识库:在诸如医疗和法律等一些专业程度较高的行业中,将专家的经验和知识表示成库,支持计算机自动处理共性的问题。例如,建立疾病、症状、药品、化验手段等相关的医疗知识图谱,可以回答与症状和疾病的逻辑有关的共性问题。
数据决策:在医疗和法律等专业的行业领域,当需要把专家经验知识形成库,并采取个性化的方式去服务新的目标时,需要更深一层开展知识计算。此时知识图谱既可以帮助理解个人信息如疾病咨询并进行决策,又可以基于现有案例库发现更多的决策依据。
这些不同的场景给知识图谱的创建和应用带来了不同维度和不同难度的技术要求,体现在以下几个方面:
(1)目标是否动态性:知识图谱中的目标是否动态可变的,例如建立一个影星的知识图谱之后,是否可以在人工不干预的情况下,自动识别出新的影星;当一名影星再婚之后,是否可以在人工不干预的情况下,自动识别他的新配偶。
(2)目标是否多样化:知识图谱中的目标类别是否明确的定义了很多种,例如人物知识图谱是否能根据职业角色将人物定义划分为几百种,并自动识别每一个新目标的职业角色;当职业角色带来特定的关系限制时,能否自动补全这些关系,例如当自动识别出一个人物是教授时,也自动识别出他的研究领域、指导学生和开设课程等。
(3)关系是否细粒度:除了目标因为类型不同存在多样化的情形之外,目标之间的关系也可能存在细粒度的不同。知识图谱能否准确的细分处理这些关系,并自动识别新的关系。例如,人物之间的关系有很多种,父子,师生,表亲,同学,同事,上下级,朋友,等等,人物知识图谱是否能将目标之间的关系细化至此。
从这些不同的技术维度来看,上述场景对知识图谱的质量有着不同的要求。例如,企业内部的信息检索可能因为待检索文档相对固定,而对目标是否动态、目标和关系是否多样化细粒度基本没有要求;而数据决策因为要全面考虑不同的因素对最终结果的综合影响,在这三个方面都有很高的要求。我们可以用一个表格描述如下:
由此可见,行业知识库和数据决策这些场景所建设的知识图谱的质量水平是有着较高要求的。
在技术实现上,对这些不同质量水平的知识图谱,可以采取相应的自然语言处理技术予以实现,它们的技术难度和资源成本也可以用一个表格描述如下:
例如,如果为了检索信息而打造知识图谱,由于存在相关的开源软件,,识别出人物和机构等实体之间的共现关系并在检索结果中予以显示,只需要具备基本自然语言处理技术能力的工程师一周的开发就能实现出不错的效果;而为了开展各种不同的数据决策去个性化的服务客户,技术难度会很大,往往需要资深的技术专家团队长达数月的共同努力。
相关阅读:
建立一个知识图谱的合理成本是多少
网感认知云如何实现人工智能应用
网感至察发布“认知云”新产品 ——提供一站式知识图谱服务
领取专属 10元无门槛券
私享最新 技术干货