为了促进对用户查询和对话的自然语言理解,各大搜索工具常常会使用到扩充式对话理解技术,为此,微软设计了一种扩充的对话理解体系结构的专利技术。
文|甘佳伟
校对|诗诗
图源|网络
集微网消息,搜索技术是我们日常生活使用较多的一项技术。当你想了解一项事物时,你会使用百度搜索。当你需要一个旅程安排时,你会使用智能助手去查询旅程中的各个细节。当你在购物需要了解商品的购物信息时,你会使用到智能客服中的搜索查询。而在这些使用到的搜索技术中最重要的一个环节就是对话理解。
对话理解,简单点说就是让机器理解语言,而这里的语言称为自然语言。
我们在使用搜索引擎的时候,交流的对象是搜索引擎系统,对话的语言是用户查询语句和搜索引擎系统反馈回来的信息。
从公开的专利上来理解扩充的对话理解体系结构,当整个系统从用户接收自然语言短语时,短语可被翻译为搜索短语且可在搜索短语上执行搜索动作。
首先,小编带你从整体上来理解该体系结构,整体结构图如上所示,接收用户的自然语言短语的是用户设备,然后通过网络的通信与系统的服务器进行交互。
整个系统服务器主要包括5个模块,其中最核心的组件是谈话管理器,该组件管理与用户的基于谈话的对话,该组件是多源输入,主要包括经过自然语言理解技术理解过后的结构化文本,和上下文数据库中该对话的状态,和通过搜索代理去网络上搜索的返回结果。
然后谈话管理器将会组合这些输入进而来确定用户的意图,作为整个组件的输出。谈话管理器组件根据识别的用户意图采取动作,诸如向用户显示最终结果或继续与用户的谈话以满足他们的意图。
其他三个模块搜索代理和上下文数据库和个人代理主要为谈话管理器作服务。
在了解整个系统的整体结构后,紧接着,小编带你详细的了解对话体系结构的工作流程。
工作流程图如上,系统会对用户提供信息交流的接口也就是给用户提供输入的界面,进而接收来自用户的搜索请求。
接下来的收集上下文状态步骤就是在为理解用户意图做准备,此步骤主要是根据输入的自然语言和系统的上下文状态数据库将用户的意图表述成系统理解的该输入的文本信息的上下文状态,系统将根据输入的自然语言的上下文状态生成对应的用户目标,基于生成的目标提供给用户建议选择的动作。将提供的建议选择的动作反馈给用户选择。
用户根据选择再次执行动作,供系统进行分析,再次更新查询的上下文状态,系统再次根据状态判断是否需要创建目标,如果不需要创建则判断是否完成了系统预创建的目标,如果完成则对话结束,没有则再次根据目标提供给用户建议选择的动作,如此循环。
到此,小编的介绍就告一段落了,如果大家想要了解更多内容,请持续关注吧。
END
领取专属 10元无门槛券
私享最新 技术干货