AI科技评论按:今日,微软在官网发文总结了其 25 年来的人工智能研发历程和对未来的展望,其中重点提到了虚拟助理以及开放技术。本文由AI科技评论进行编译。
25 年前,微软就已开始投资人工智能领域,随着新一代聊天机器人 Zo、Cortana Devices SDK 和 Skills Kit,以及各种智能工具包和框架的推出,二十几年的愿景逐渐成为现实。
“如果根据很多基准来看,微软的计算机视觉算法超过了业内其他企业——甚至包括人类。”微软全球执行副总裁沈向洋昨日在旧金山的一次小型人工智能会议上说到,“令我兴奋的是,我们在计算机视觉的进步已经体现在 HoloLens 等产品中,包括 Uber 等客户也在使用这些技术和功能”
盖茨在 1991 年创立微软研究院时,他希望计算机有朝一日可以看懂、听懂和理解人类,这一宏伟目标也成功吸引了大批顶尖人才加盟微软研究院。
今年 10 月,微软在语音识别能力上有着突破性进展,使之成为首家能在语音识别准确率上媲美人类的公司。Skype Translator 也同样有着很大的进展,已经支持 9 种语言,这也是从研究到产品开发的整个过程加速发展的典型案例。
Skype Translator 可让世界各地的人能听懂并理解彼此的语言,而且几乎没有延迟。能否实现面对面实时翻译?借助全新语音和语义识别技术,微软 Translator 现可实现多语种同声传译,帮助世界各地的人建立联系,打破语言障碍。
除此之外,微软还建立了世界上最大的知识图谱。基于必应搜索和 Office 365,使得微软可以理解数十亿的实体:包括人和地点、各种物体。我们现在将会把“世界上的常识”与人们的“工作知识”连接起来。
微软的愿景很大胆:我们计划在虚拟助理、应用、服务和基础设施等多个领域实现真正的人工智能系统。微软希望向所有人提供人工智能技术,包括消费者,企业和开发者,让他们都能在这些技术中获益。
“我们一直希望实现技术民主化。借助人工智能,这一目标计划在两年内实现——将其整合到 Office 365 等产品后,打造一个方便他人使用和创新的平台。”沈向洋说到,他还自称是“研究型产品经理”。
这个技术平台包括 25 项认知智能服务(Cognitive Services)的 API,可提供语音、语义、知识图谱和搜索方面的人工智能技术。
当然,仅仅拥有产品和技术是不够的。要在人工智能浪潮中取得成功,与各大型机构深度合作必不可少。
沈向洋提到:“我几周前跟山姆·奥特曼一起来过这个房间,宣布了我们在 OpenAI 方面的合作。能与他人展开合作,并帮助其开发项目,是件非常好的事情。”
当下我们正在目睹计算行业的新一轮重大平台转型,此轮转型的动力来自 AI,其中重头戏是人类最自然的行为:对话。数字体验将会模拟人与人之间的互动方式,以往需要人类去理解计算机,而现在则是让计算机理解我们,甚至为计算机赋予前瞻性。
对话机器人分两种类型:一方面是完成任务和指令,另一方面是情感交流。如果对话机器人能在两两方面表现十分优秀,这才是人工智能的前景。
微软的长期战略是不仅能为 Cortana 这样的虚拟助理赋予智商,还要为它赋予情商。这一想法已在微软的聊天机器人服务中与有着一定的突破性进展。
而 Zo 就是这场进化和突破的新力量。
Zo 是一款社交聊天机器人,它以小冰和 Rinna 的技术为基础。而这是两款聊天机器人在中国和日本均取得非常大的成功。你与 Zo 可以在社交网站 Kik 上像朋友一样互动,微软还计划将其引入 Skype 和 Facebook Messenger 等社交媒体。
Zo 的开发过程中吸收了大量社交数据。她通过人类的互动学会了如何利用有感情、有头脑的方式进行回应,其不但能提供独特的观点,还能说出适当的礼仪和情感言辞。除此之外,微软也为其设计了强大的制衡措施,避免该应用被恶意攻击,使其“黑化”。
微软从 2014 年 5 月开始研发聊天机器人,最早的产品是小冰。小冰已拥有 4000 万用户——超过加州的人口总和。她与用户的每次对话平均有 23 个回合,几乎是业内平均水平的 10 倍。
除此之外,小冰还是第一个在上海东方卫视从事电视广播工作的聊天机器人。继小冰之后,微软又在日本推出了 Rinna。如今 Rinna 会定期与 20% 的日本人展开对话。
Zo 已在美国和 10 万人进行了对话,其中对话超过 1 小时的用户高达 5000 人。Zo 保持了微软聊天机器人迄今为止最长的连续对话记录:共 1220 回合,持续 9 小时 53 分。
“这是非常个性化的体验。原先是以机器为中心,现在变成了以人为中心,从感知变成了认知,从理性变成了感性。”沈向洋说到。
微软推出 Bot Framework(微软开发的一款可让任何人制作自己的聊天机器人) 以及全套的工具、云服务和数据。无论是大公司还是小公司,开发者和客户都可借助微软的技术进行开发和实验。
我们已经掌握了客户如何使用我们的云计算服务来开发机器人,从而简化流程,为客户提供更佳的服务。具体案例包括:日本高知银行正在研发一种前台机器人;自动化生产机器人 Rockwell Automation;澳大利亚健康服务部也开发了自有机器人来加强与用户的互动。
“我们讨论过机器人大脑的概念,很多人都认为这是这个 10 年面临的挑战。我们对 Bot Framework 的愿景和我们的提供的开发服务不仅限于让用户更容易起步,还希望让这些未来场景触手可及。”微软 FUSE 实验室总经理 Lili Cheng 说到。
目前拥有 7 万以上的开发者使用微软 Bot Framework 和认知服务。新服务还将陆续推出,包括为微软 Teams 新开发的机器人连接器和 Cortana Bing Location;新的 QnA Maker 服务:它可以解答企业收到的最常见的问题,甚至让非开发人员设计自己的机器人,从而轻而易举地回答问题。
“利用微软 Bot Framework 工具和微软 Graph,我们可以在人们的个人和职业生活中提供全新的使用场景。这些创新会出现在各种应用、电子邮件、聊天平台、移动设备和联网设备中。”Skype 副总裁阿姆里塔什·拉格哈夫(Amritansh Raghav)说到。
客户欲充分利用这些机器人,其中一种使用方式就是借助 Skype 和微软 Teams 的使用体验。通过已经开放的 API,Skype 现在可为合作伙伴提供聊天机器人和工具,帮助其开发富媒体卡,允许用户向这些机器人中添加视频、动态 GIF、音频等信息。
在促进交互体验时,与其合作的伙伴发挥了重要作用。Hipmunk 是其中最早的之一,该公司去年初就在 Skpye 推出了自己的的聊天机器人。
Hipmunk 联合创始人亚当·古德斯坦(Adam Goldstein)说。“我们认为,虚拟助手是一种自然的扩展。目前来看,它或许也是帮助人们规划和安排旅行的最佳方式。Skype 的聊天机器人目录可以方便人们找到自己需要的聊天机器人,从而简化他们的生活。”
微软在思考对聊天机器人的前景时,Cortana 这样的助理扮演了重要角色。当今世界有 13 个国家和地区的 1.45 亿人在使用 Cortana。它非常开放,扩展性强,可以跨平台使用,兼容各种联网设备。
每个用户都应该配有自己的虚拟助理,它可以帮助我们处理很多事务,提高效率。
“为了实现承诺,我们需要集中精力解决能减轻你负担的痛点。有一半人会通过电子邮件发送计划和任务提醒。也有很多人会制定一份待办事项列表,我曾在办公室墙上贴很多便笺。所以,我们正在消除这一过程中的阻力”微软合作伙伴事业群项目经理马库斯·阿什(Marcus Ash)说。
Cortana 可以兼容许多移动设备平台,目前还可以通过 Calendar.help 服务发送电子邮件,Expedia 也以此为基础开发了旅行应用,Capital One 开发了银行应用。这场征途的下一阶段是把 Cortana 提供给所有 PC 设备厂商,把 PC 设备变为更智能、更有用的设备。
这正是 Cortana Devices SDK 的作用所在,微软正在与各种设备领域的伙伴展开合作,将 Cortana 整合到他们的设备中。Devices SDK 可以把 Cortana 在效率、音乐、家庭自动化控制和设备控制方面的服务功能提供给用户。
通过与高端音响制造商哈曼卡顿合作,Cortana 还将以新的方式出现在你的房间中。
微软相信,突破性的技术是通过持续不断的探索和长期坚持才能实现。
人工智能虽然取得了很大进步,但仍有不少难题急需解决。如互联网、移动设备和应用经济等产业发展期间所经历的起起伏伏,人工智能也同样需要面对。
“我们将不断学习、不断超越自我,还将与整个行业、与所有用户分享我们的成果。所以,我们可以实现人工智能的民主化,并希望让人工智能的红利加速扩散在社会中。”沈向洋总结到。