微软小冰由微软(亚洲)互联网工程院于2014年5月正式推出,是一个融合了自然语言处理、计算机语音和计算机视觉等技术的完备的人工智能底层框架和系统。该框架注重人工智能在拟合人类情商维度的发展,强调人工智能情商,而非任务完成,在人机交互中的基础价值。
经过数次迭代,2019年8月15日,小冰已进化至第七代。第七代微软小冰已成为全球最大的跨领域人工智能系统之一,产品形态涵盖社交对话机器人、智能语音助理、人工智能内容创作和生产平台等。在全球多个国家,微软小冰单一品牌已覆盖6.6亿在线用户、4.5亿台第三方智能设备和9亿内容观众,在交互场景大幅度拓宽的情况下,微软小冰与用户的单次平均对话轮数(CPS)仍保持在23轮。
近日,微软小冰首席科学家宋睿华、微软小冰首席NLP科学家武威及微软小冰首席语音科学家栾剑向记者分享了小冰近一年间的最新研发进展,展现了小冰背后的研发 情况。
武威介绍称,小冰发展的目标是成为一个“自我完备的对话机器人。“他应该具有的能力包括:1、学习。2、自主管理。3、连接。对话机器人发展到今天,除了微软小冰以外,实际上是整个业界、工业界、学术界一起努力得到的成果,小冰在里面做了很多开创性的工作,但如果没有整个业界的努力,对话机器人产业不会发展的这么快。
第七代微软小冰升级了微软小冰的部分核心技术,主要包括核心对话引擎、全双工语音及多模态交互感官等。其中:
全新的对话引擎:经过检索模型、生成模型、共感模型的历次技术迭代,本次升级的对话引擎实现了从“平等对话”向“主导对话”方向的跨越。它不仅能提高开放域的对话表现,也能在垂直领域发挥高转化率的效果。以在美国进行的“在线零售垂直领域”测试为例,新的对话引擎向商品页面转化率高达68%,比上一个版本的转化率提高21%。
全双工语音交互感官:微软小冰于2017、2018年分别上线了全双工语音交互感官的传统电话及智能音箱设备落地,此次新增车载场景,可大幅度提高人工智能助手与驾驶员及乘客的交互体验,促进人工智能从智能中控向“虚拟乘客”体验标准的转化。
面向未来的多模态交互感官:是一种融合了全双工语音交互、实时视觉与核心对话引擎的全新交互感官。它能够实现用户与人工智能同时边听边说边看的交互体验。继去年宣布率先开始多模态感官的研发后,今年2月,微软日本小冰团队已邀请当地媒体进行了公开测试。该感官有望成为5G时代的全新交互形式。
【来源:Techweb】【作者:Suky】
领取专属 10元无门槛券
私享最新 技术干货