12月20日,由全球领先的儿童科技媒体平台——极客爸爸主办的“2018儿童未来创新大会暨2017Jikebaba Awards 颁奖典礼”在上海小南国花园酒店隆重举行,百度度秘儿童创新事业部负责人周华先生带来了有关“智趣·未来,DuerOS智能玩具解决方案"的精彩分享。以下为现场速记稿件整理。
周华:今天非常高兴能和业内的朋友及专家在一起,分享一下我们在儿童方向的技术赋能。这是我今天演讲的标题“智趣·未来”,介绍一下我们百度DuerOS人工智能平台。DuerOS主要是做自然语音的交互,在现场有很多厂家在使用我们的儿童智能语音交互平台。
我们先回顾一下在前面20年人与机器交互演进历史,最早的时候在PC时代,我们跟PC和电脑对话主要是通过键盘或者鼠标,那个时候门槛还是比较高的,如果你不会五笔、拼音输入法,你很难跟电脑交互。在2008年开始,我们进入了一个移动互联网的时代。在这个时代主要交互的屏幕就变成了触摸屏,我们通过手指就能完成非常自然交互。在AI时代交互方式应该是什么?人最有效的输出方式是通过语言,输出能力非常高。所以我们判断在AI时代,也许最好的一个交互是靠手势、语音,而且语音是一个最高效的输出方式。
随着这种交互方式变得越来越自然,使用它的门槛变得越来越低了。以前年轻人在用手机,手机对于小朋友、老人来说,还是一个非常困难的事情。到了AI时代用户受众越来越多了,儿童有这个能力通过语音的方式和机器进行交互。
这是百度AI大地图,百度从来就是一个偏技术化的公司。在上面语音的唤醒和识别,我们投了非常非常多的人力和资源,我们百度有一个人工智能团队。地图下面是我们对于在视频、图像方面的能力,比如说像人脸识别、OCR,还有一些自然语言的处理。在所有计算的背后,都少不了大规模机器学习的硬件平台提供支撑,目前这个都地图上所有的能力,其实都是通过百度都可以找到对应的接口,去了解更多的详情。
百度AI大地图
怎么样才能做好一个儿童语音交互呢?DuerOS一直在说,我们做的是人工智能。那人工智能一定要最好能够理解人类的语言,能够理解人类的意图。对于儿童来说,做好儿童的语音交互有三个非常重要的一点,第一个听清,小朋友说的话能够被机器理解成文字,“我要看西游记”这五个字能够正确的被识别出来,没有海量的数据你要训练一个儿童的模型是非常困难的。
我们的语音有一个开放平台,它其实在几年前就已经对外开放了。从今年11月份的时候,整个语音开放平台是对外免费,大家可以去使用。在这个平台上面,我们之前搜集到了非常非常多的儿童语音数据。通过这些儿童的语音数据加上人工的标注,我们就做出了一个业内非常顶尖的儿童语音识别引擎。
在听清楚儿童文字以后,下一步就要对文字进行一个理解,理解儿童语义相对来说是非常非常困难的。我给大家举一个例子,我们看过很多儿童语言交互的文本,我们发现很多很多的文本有一个特点,基本上在很多场景都出现过,就是掐头去尾,第一个字少了或者最后一个字少了。“我要听小苹”,“小苹”是什么?下面一定是小苹果。
所以对这种儿童语义的理解,要做一个人工的标注然后才能训练出一个非常好的模型,让我们的机器能够理解儿童具体的含义是什么。还有一个场景比方说成人的表达就是我要听《黑猫警长》,小朋友可能表达更加直接一些,他就会问黑猫警长。这个时候咱们需要理解他,他到底是想要知道《黑猫警长》的故事,还是要听《黑猫警长》这首歌,还是说要看《黑猫警长》的动画呢?这些我们都是在听懂的基础上需要做大量的工作,分析用户场景以后才能得到更加精准的理解。
在听懂的基础上,更深层就是要对儿童语音的满足,他如果有问题我们要能够精准的回答他。他如果要引用一些内容,我们能够从海量的内容中最准确的找出那一个内容来。在这里面我们也可以看到有很多小朋友点播一个内容的时候,不会按照成人的方式点播。
比方说成人会说我要听周杰伦的《青花瓷》,这首歌很自然的就被点出来了。但是儿童思想会非常跳跃,“莲花洞”。大家知道莲花洞是什么吗?我要听“火焰山”,有一些标准可能火焰山能够找的出来。所以对内容、资源并不是越多就越好,其实要对内容和资源投入非常多的人力和计算,才能挖掘出其中内容知识库,对儿童请求的满足。
这个是我们百度DuerOs对外完全开放出来的,一套免费的儿童语言交互服务。在这个平台上面,我们第一个提供了信息智能的检索,做到有问必答,这主要是针对内容类的。目前来说有合作方,像喜马拉雅等,业界还有一些付费内容也在我们平台上做一个对接。我们在这些内容基础上面做了非常非常多节目的清洗,把故事、儿歌、国学、百科、英语,这些最常用的分类划分出来了以后,同时我们还有很多子分类,比方说寓言、成语、历史、地理,儿童都可以通过语音来点播到。
我们在做儿童方向是今年开始做的,百度积累了非常多的资源,但是儿童方向是从零开始起步。不到一年的时间内,我们打造了一个非常非常棒的儿童智能百科。这些智能百科不是从零开始的,大家都知道百度百科有几亿的用户。在这个用户的基础上,我们都对数据、内容都做过一些针对儿童的改造,比如像汉字的问答三个金字念什么?某某部首的偏旁是什么?极客爸爸的“极”字有多少笔,它的偏旁是什么?这些我们都针对儿童需求做过特地内容的开发。
当然,还有像文学的问答、十万个为什么、动植物、中英文互译的能力,都是通过DuerOS这个儿童平台对外可以开放,大家可以免费使用的。这个其实也不算我们炫技的,在儿童经常会问到中国的第一长河,地球和太阳有多远?从北京到上海有多远?苹果的英文叫什么?世界上最高的山峰是什么?爸爸的爸爸叫什么?这些我从哪里来,其实都在我们针对儿童内容的大招中。
前面是我们第一层次输出的能力,今天我们主打的是让小朋友的问题都能得到满足的回答,但是真正做好儿童语音交互还有很重要的一点,这也是我们根据自己的历史数据发现。在儿童交互里面,儿童和设备对话,他的对话周期不会超过5条。80%集中在5条之内,90%集中在13条之内。也就是说,最多问完13句话以后,这小朋友今天不会再和机器做一个交互了。
基于前面的一种判断,我们相信STEAM教育领域会产生比任何教育公司都大的公司。这种大不仅是本身上市的市值,还包括它在社会上的影响力,以及对孩子们未来成长中起到的相应作用。其实很多朋友已经了解了STEAM教育包含的,它是融合了这五门的一个综合性素质教育。而Makeblock用不同的方式去提升五个方面的能力。
我们在明年的时候我们会重点基于这种主动性的交互,会做一个非常大的投入,包括内容的推介、儿童聊天。像我们小朋友经常会问的:你很聪明呀。现在的聊天可能说:是啊,我是很聪明或者说你也很聪明。但是没办法继续接下去了。像爸爸生气了,同学欺负我怎么办?这些小朋友经常问的一些问题,这个目前来说做的不是非常好,我们明年会做一个很大的投入,就在做这个主动式的语音交互,寓教于乐,我们争取儿童和AI的对话能够从5句、13句到26句,甚至更多。
明年还有很重要的一点,咱们有很多内容的厂商,有上游服务的厂商参与到这个活动当中来。我也希望这些厂商能够跟百度一起打造一个儿童早教的生态,可以把你们优质的内容通过DuerOS这个平台,输出到更多的终端产品上面去。当然,做智能硬件可能大家现在最不愿意谈的就是安全了,因为硬件上的能力很重要,但硬件上的安全要付出一个很大的成本。
举个例子就是儿童手表的安全,攻击者是百度实验室安全专家,他可以利用手表上的漏洞、传输协议的漏洞、云端服务的漏洞,可以很容易伪造父母的来电给小朋友拨过去。甚至可以把小朋友周边所有的聊天记录都给抓取进来,这个还是语音的。我们看的到越来越的儿童产品,不管是机器人也好,儿童的平板也好,上面都有一个摄像头。大家知道最近360摄像头炒的也比较厉害,其实儿童平板上的摄像头同样也是一个非常容易被攻破的一个设备。
所以智能硬件的安全,我们希望作在这次分享中能够给大家提到一定的高度,让大家有所警觉。我们有一个叫OASES的安全联盟,比方说你的设备如果是个智能硬件可以接入这个平台,由平台自动来给你打补丁。这个完全对用户来说是无感的,我们通过这个平台可以提供完整的一套安全服务。
怎么和DuerOS做一个对接呢?DuerOS是一个开放的平台,所有的厂商,不管是什么样的硬件形态,只要你有语音交互的需求,都可以跟他做一个对接。目前来讲我们通过两种方式可以直接使用DuerOS的能力,第一个是通过DuerOS方案商,假设有一家厂商需要做一款产品,但是您的人力主要在运营和产品上面,研发稍微偏弱的话,我们可以给您推荐一下DuerOS的方案商。目前接入DuerOS的方案商接近40家,根据您不同的需求我们都会有不同的方案商,来服务您,帮你定制这个产品。
还有一种方式,如果您的公司有自己的研发团队的话,我们会通过DuerOS设备开放平台,您可以购买模组、芯片,DuerOS能力都已经集成在芯片上了。你可以访问dueros.ai来了解这个平台,在这个平台上面你可以做自己的设备开发,定义您设备的能力。举个很简单的例子来说,我们做好一个儿童玩具,你要给它做一个署名。比如说某某熊,你就可以通过这个平台来给它定义某某熊的产品,儿童问它叫什么名字的时候,这个产品就能回答出来说我叫某某熊。
儿童客制化的能力都可以通过DuerOS,这个设备开放平台来实现。当然,我们也有APP开发、WAP开发这些相应的工具。通过我们一整套工具,您就可以打造您自己的产品。
在场的有很多已经是DuerOS的客户,甚至我们DuerOS上游的合作伙伴,我们希望有更多的合作伙伴能够和DuerOS一块打造业界最优的儿童产品,能够成为我们的合作伙伴,也希望有人能够加入到DuerOS这个团队里面来,谢谢大家。
全球新奇特:蔬果味的展览|一年能省一个亿?|超能力手套|WeeeBot Mini酷跑侠|
炫酷视频:指尖猴|酷到极致的Cozmo|AI战斗赛车|力压iPhone X|公牛历险记
精彩活动:
产品试用:丁丁冬冬卡片机器人|
领取专属 10元无门槛券
私享最新 技术干货