文丨亿欧现场作者 王瑞
8月29日,由国家发展和改革委员会、科学技术部、工业和信息化部、国家互联网信息办公室、中国科学院、中国工程院和上海市人民政府共同主办“2019世界人工智能大会”在沪举办,亿欧作为官方合作媒体为您带来精选分享。
成立于1999年的科大讯飞股份有限公司,是一家专注智能语音和人工智能的上市企业,致力让机器“能听会说,能理解会思考”。科大讯飞董事长刘庆峰认为,在拥抱人工智能红利时代的到来前,首先要思考我们需要何种形式的人工智能,而科大讯飞为此在教育、办公等多个领域做了尝试和努力。在人工智能领域,哪些是真金白银,哪些是虚假概念,需要我们的辨别。2019年,人工智能是大潮退去还是红利到来,取决于能否成功落地。
以下是他的最新产品汇报和精彩演讲实录(有所删改):
各位来宾、各位朋友,大家下午好!很高兴再次来到世界人工智能大会的现场,这个声音听起来有点怪,不像是刘庆峰本人的声音,我们索性变得更大一点。每一次来到上海,见到各位新老朋友我都觉得特别地开心,因为人工智能需要大家携手合作,共同创造美好的未来,好的,切回来吧。当然,刚才给大家秀的是一个变声技术,因为刚刚IBM大中华区的董事长说他声音哑了,我觉得这个技术可以帮助大家变成各种想要的声音,使我们的生活变得更加轻松和愉快,我想这也是人工智能本来的目的之一。
今天给大家分享的主题是“拥抱人工智能红利时代的到来”。在讲到拥抱这样的红利之前,我们首先要看一下我们到底需要什么样的人工智能。其实人工智能从1956年的概念提出来到今天63年了,我们大家都在考虑这样一件事情,我们所需要的人工智能首先应该是阳光的、健康的,不仅改变世界,而且是建设美好世界的。另外一个,我们所需要的人工智能应该是遵循基本的科技规律的,同时也是按照基本的商业原则和逻辑的,而不是那种冒进的,忽悠概念的人工智能,这是我们今天所需要的人工智能。
其实我们可以从科大讯飞的人工智能开发平台上的开发者数量可以看到其中一部分的现象。
2016年,科大讯飞平台上的开发团队是13万家,现在是105万家,继续保持高速增长的领域包括了教育、办公商务、摄影摄像机等等,当然还有一些增长比较快,但是开发者数量已经开始放缓的,从游戏、影视、出行等等。当然,这中间一个数据说明什么呢?说明快速增长,但是增速放缓头部效应开始显现,行业开始逐步汇聚到几个大佬名下,所以说开发者再涌入就会变少,而在教育、办公商务和摄影摄像领域不仅是代表着未来很重要的方向,而且创业者依然有更大的机会,所以有非常多的创新创业者涌入进来,在上海现在有将近7万个开发团队围绕科大讯飞的技术在做各种应用。
另外一个就是所谓的真金,到底有哪些虚的概念?我们可以在过去两年频繁地看到人工智能被某些机构和创业者变成是所谓收割智商税的概念,很多不靠谱的说法。今天其实是通用人工智能刚刚开始起步,机器的常识推理还没有达到6岁孩子的水平,但是只要在专业领域有足够的数据,有规律可循的方面,机器就可以超过普通专业人士,可以超过90%的普通专业人士,这就是今天我们面对的现状,所以因此我想这样的世界人工智能大会通过这样的交流和沟通让科技界、产业界,以及应用界和普通的公众更多地了解人工智能,对人工智能进行知识普及和合理预期,在当前时代具有非常重要的意义。
2019年,大家在讨论人工智能究竟是大潮退去,开始泡沫破灭,还是真正地应用红利开始到来呢?我觉得非常重要的一个标志就是我们谈应用红利一定要谈人工智能能不能落地,所谓的概念和泡沫就是虚无缥缈,你说得好听,没法看得见、摸得着。我们认为人工智能必须有规模化应用,如果没有规模化应用就不足以谈人工智能应用。
因此在今年年初科大讯飞基于对人工智能最新发展的判断,我们提出来,我们如何判断?不要去做无效的辩论,不要变成无缘者的争论,大家要有一些科学的标准。我们今天认为这三项标准应该就是判断人工智能红利兑现的依据。第一,能不能有看得见、摸得着的真实案例?其次,这样的案例到底是靠重金和人力所堆出来的面子工程、形象工程,还是说可以规模化推广的产品?这是非常关键的。第三,这些规模化的推广产品不是因为你是人工智能,社会就会接受,一定要能够有统计数据证明它的应用成效,节约了多少成本、提高了多少人力和效率,以及减少了多少的危险岗位等等,有了实际应用案例,有了规模化推广的产品,有了能用统计数据证明的成效,我认为人工智能的红利就开始到来。我们在越来越多的领域可以看到这三大标准开始可以实实在在地看得见、摸得着。
我们在上海的“人工智能+司法”,这样一个红利在上海的2016人工智能刑事案件辅助审判系统自2017年启动以来,从当时的杀人案等等的试点,现在覆盖到102个常见罪名,而且在上海的公检法体系是常态化使用,已经在使用过程中自动提示了证据瑕疵将近8000个,判断民事案件将近1万个,可以很好地用人工智能防止冤假错案,因为可以发现证据的自相矛盾和证据链的错失等等。今年1月23日,在上海第一次人工智能庭审,让关心它的老百姓、媒体朋友和法学专家都可以到现场来听,取得了成效,这是我们讲的对司法的帮助。
对教育,科大讯飞我们承接了国家发改委教育重大专项,我们统计了中国学生过去两年35亿次作业,我们发现有60%是无效重复作业,因为一个班的同学回家做的作业都是一样的,很多我们会做的作业回到家要重复去做。有一些学习相对后进的同学一晚上也不可能做出来,给他这些难题只会打击他的自信心,老师想做因材施教,但是实在精力顾不过来。而有了AI技术,我们可以通过OCR自动汇聚学生数据,客观题、主观题、作文都可以评分比老师还准。不光是在上千所学校使用,在今年5月21日,我们就在这个会场发布的科大讯飞学习机,现在短短几个月时间,我们可以看到平均用户中有将近一半的学生每天都在用,因为这是课堂使用,老师如果在课堂上几乎可以90%的汇入,这个是拿回家作为老师作业之后的帮助,竟然有将近一半的同学每天在用,而且在同样知识点中已经给他的效率提升了286%,这就是我们说的实实在在的应用成效。
另外,机器翻译已经累计提供了5亿次以上的翻译,58种语言,覆盖了200多个国家和地区。不仅是在这些领域,刚才大家说专业八级,我们在去年底大学六级的考试之前,机器提前几天在考场,当考题解密的时候,教育主管部门现场监督,机器在15分的翻译题中超过了99%的大学六级考生。在今年年初通过的国家翻译师资格水平考试,这个翻译师资格水平是远超专业八级的难度,应该说人工智能应用红利正在通过人机交互以及各个行业开始逐步到来,中间我们所需要的就是如何开放数据,如何打通算法和数据之间的衔接,形成刚需应用场景以及数据自我迭代驱动的典型人工智能的应用状态,这种方式出来以后将不仅推动人工智能在各个领域的落地,也会使得中国未来的产业升级在全球真正地具备了切实的领先优势。
当然,有了这些应用红利的落地,其实核心的出发点还是核心技术的突破。因为人工智能跟互联网最大的不同就是人工智能是强技术的,不是光有点子、有想法,敢于做商业模式创新,敢于贴钱就能做成功的,所以我非常希望跟大家分享的这两个超出我们预期的例子。一个就是翻译师资格考试,原本我们认为2019年的目标是机器达到专业八级,没想到率先完成了,我们算法中在半机器监督训练中有重大突破。第二个是在机器自然阅读理解中,我们在今年3月份在全球所有顶尖机构都参加的情况下,Facebook、微软、谷歌都参加的情况下,英文机器阅读理解科大讯飞在国际上首次两项指标都超过了人类平均水平,这个标志着机器阅读理解突破以后,认知技术领域在各个方面有突破,看懂卷宗让法官成为可能,一个又一个的领域,包括看懂我们的各式各样的文章从而翻译成为可能等等。
当然还有一个非常重要的就是应用场景的开放,我觉得上海召开世界人工智能大会确实是众望所归,因为确实有很多开行业的先河。比如中国第一个考试制度阅卷系统在上海成功,现在也是全行业独一的,超过人工阅卷的系统。第一家人工智能电信诈骗防范系统,在上海开通,机器自动防止诈骗电话的及时判断准确率做到99.7%,远超人工,在上海率先成功。刑事案件的辅助审判,以及脑科学和人工智能的结合,包括去年第一次在上海外国语大学做了机器和同专译员现场PK的比赛,机器也获得了令人非常鼓舞的成果。今年5月21号还在这样一个会场,科大讯飞年度产品发布会,我们的虚拟主播用英语、日语、汉语、西班牙语、俄罗斯语、藏语、维语等八种语言全球直播,这也是人类历史上第一次科技公司的虚拟主播的多语种发布。应该说很多东西我们在上海都有可能形成应用迭代之后的数据自我驱动和进化的趋势。
最后还想再说,今天人工智能其实我们绝不仅仅是说规模应用就结束了,还有大量的基础型工作要做。深度神经网络是推动了第三次人工革命浪潮的核心动力,但是也面临非常多挑战。比如说所有训练基本上需要大量的样本,所有训练都要用人工标记以后进行训练,所谓大样本监督训练,而不是无监督训练。针对很多问题都必须在一个领域中进行大量数据的共性学习,如何持续突破。比如说深度神经网络的很多参数,是需要我们高水平的研发人员靠经验不断调,手动调参的。我们学一个机器全科医生需要三年时间,如果机器能够自动通过算法突破,三年可以缩短到半年。现在我们有很大的突破,深度神经网络需要大样本,原来做一个机器翻译,五千小时的语料才能做,去年的IWSLT最新端到端翻译两百小时做一个语种,科大讯飞遥遥领先,比的是德语和英语翻译,从大样本变成小样本,以及全监督训练变成半监督训练,甚至无监督训练。
比如说我们对外部辞典的翻译,原来需要一亿,现在可以节约10倍,一千万就可以。类似这样的算法突破,不断创新,就可以使得人工智能在一个一个细分领域,从原来需要花5到10亿的成本,需要三到五年的时间,变成需要三个月到五个月,只需要花几千万就可以落地一个行业,从而极大推动人工智能为各个行业的赋能。但是我在这里更想说的是,我们希望通过了无监督学习,通过小数据,通过自动定参,能够使我们人工智能为每一个个人进行训练,从而使得人工智能时代人机耦合,让每个人站在人工智能的肩膀之上成为更强大的自己,而不是被人工智能机器所替代。所以我认为人工人机耦合,才能代表人工智能最好的未来。因此不仅是帮助每个个人,我们也开始用人工智能做更多的社会公益,用科技帮助更多人才是真正的人工智能红利。比如说AI的无障碍公益,我们已经帮助了50万听障的患者,听力有问题,可以用眼睛看语音,因为我们用语音识别变成文字。眼睛有问题,没问题,可以用耳朵听文字,语音合成把文字念出来。同时我们也启动了方言保护计划,不光要保护中国方言,要抢救全球方言。
因此,我们想说的是科大讯飞的历史使命是让机器像人一样,能听会说,能理解会思考,用人工智能建设美好世界,因此建设美好世界的不是人工智能的使命,而是掌握了人工智能的人类的命运,我觉得这是关键。在最后,我特别期待着在这样一个技术进步、产业理解、社会伦理、人文和法律齐头并进的情况下,我们能用人工智能创造更美好的明天,有一首童年在这里送给大家。大家知道刚刚在两周前国际语音合成大赛英文的我们又是全球第一名,但是这是机器唱歌,不光可以读文字,可以唱歌了,给它一段旋律,你随便谱曲,随便谱文字,它可以直接唱出来。用这一段AI唱歌合成送给今天大会作为结束语。
最后一个小的tips给大家,我觉得人工智能要因人而能,让人工智能能够服务建设美好世界,也要源于热爱,做长期的源头技术创新。今天所有的演讲,我们大家看到讯飞听见系统实时转写成文字,还可以翻译出来。我特别想说一句,因为我们基于了最新的小样本和无监督学习,我们今天的机器翻译不仅是全自动翻译,而且不联网,就本地一个小设备直接做本地的离线翻译,这个在业界是独一无二的,今年5月15号联合国日内瓦总部正式下单采购科大讯飞的设备,用在联合国的会议和转写翻译之中,因为我们能够满足保密场合的需要,不光是在这样小的设备在这个会场上,甚至小小的翻译机也可以做到几十种语言,就是因为算法的突破,我们期待着未来在源头技术创新和产业应用上,共同迎接人工智能红利时代的到来。谢谢大家。
领取专属 10元无门槛券
私享最新 技术干货