早在 2010 年加入百度时,王海峰就开始了围绕 AI 技术体系的「实践」。
在那之前,百度仍没有一个单独的 AI 基础技术部门。他陆续拓展自然语言处理、机器翻译、机器学习、语音、图像、深度学习、个性化推荐等技术方向,尽管如他所说,当时「其实也不明确能用来做什么」。
不过,去解锁如此多元的技术领域,也不是王海峰最初的职能定位,实际上,他是以自然语言处理专家的身份被邀请加入百度。王海峰从 1993 年开始专注研究机器翻译与自然语言处理,成就斐然,在自然语言处理与计算语言学领域最顶级国际学术组织 ACL(Association for Computational Linguistics)50 多年历史上,他是唯一出任过主席(President)的华人。
即便是在技术研究上「战绩优异」,他没有停止边界的突破。2014 年,随着转战业务部门,三年多时间,王海峰负责了百度最核心的几个业务板块,比如搜索、手机百度、Feed 流……并在技术与业务互相协同的过程中,孵化促成了度秘等新业务。
那段时间,王海峰不仅迅速迎来个人在百度的两次晋升—— 2011 年升为基础技术首席科学家、2013 年进一步升至百度副总裁,也实实在在尝到了以技术突破带动业务产品的甜头。「我们凭借持续的技术突破创新让百度搜索始终处于领先,我们凭借技术的快速升级实现了 Feed 流量的高速增长,凭借技术的厚积薄发催生了度秘。业务需要解决的实际应用问题,以及业务中产生的大量真实数据,又促进了技术的继续创新突破。」
这让 2017 年王海峰再一次完成转身显得顺理成章。无论哪一个方向的变化,几乎都暗合了他在百度 8 年时间里的升级过程,怎么看也都是他熟悉的「战场」:
2017 年 3 月,百度 AI 技术平台体系(AIG)成立,在这之前,百度并没有一个部门把所有 AI 相关技术都整合统一在一起。原本并不相互独立的百度研究院和八个应用技术部门,有了明确的分工,前者面向基础前瞻的技术研究,后者由应用目标来牵引。技术之外,百度在人工智能领域更大的变化是对应用、平台和生态的发力,促成商业化的落地。
很明显,应用导向成为百度在 AI 这件事上的重点,而王海峰经历了从零开始打下 AI 基础、深入核心业务线的过程后,也再次回归基础技术,组建 AI 技术平台体系,就任 AIG 总负责人并晋升为百度 Estaff 成员(百度最高决策层),成为百度 AI 战略的关键「局内人」。
以下是机器之能对王海峰的专访实录(机器之能做了不改变原意的编辑):
「最重要的决定,第一步是加入了百度,第二步是除了百度让我做的自然语言处理,我还把 AI 一系列基础技术都建立起来了」
我们看到百度真正开始在 AI 方面体系化规模化的投入,应该是从 2010 年你加入之后。回看当时的情形,这 8 年时间主要经历了什么?
我 2010 年 1 月份加入百度,到上个月 8 年整的时间,我走过了三个阶段,从奠基 AI 基础技术,到负责核心业务,再回来组建 AI 技术平台体系。这 8 年,对公司的贡献、我个人的收获,都是很大的。
第一阶段,那时候百度还没有这种横跨的独立的技术部门,只有各个产品部门里的技术团队。当然,最基础的数据中心这些肯定是横跨的。但 AI 类的技术还没有横跨的部门。我加入后开始着手组建这些部门。至少在中国的各个互联网公司中,这应该算是比较领先的一个布局。所以我在百度的前四年,就把这些都陆续建起来了,从 NLP 到语音、图像、机器学习、深度学习、个性化推荐,数据挖掘等。
这个阶段奠定的基础,使百度后来在人工智能领域既有先发优势,同时也有更完善的组织架构,有更深厚的积累。
但如果仅仅如此,我认为对一个互联网公司来说其实还是不完整的。互联网公司产品迭代特别快,数据特别大,而且都是来源于实际业务。所以,2014 年初,有一个契机,当时百度最核心的搜索业务特别需要,我就转岗去负责搜索,做了三年多。
这三年多时间,我最大的收获就是每天跟产品打交道,跟用户打交道,跟线上的各种需求打交道。同时,我一直在做技术,所以我也更清晰地知道,这些技术怎样才能更好地应用到产品里面去。
我这三年多的时间,第一年从当时份额最大的 PC 搜索开始;到下半年,开始有所扩展,接手了商业平台、糯米技术平台等;2015 年,我们将 PC 和移动搜索进行了整合,这在百度历史上也是非常重要的一步。整合之后,我们就可以开始做更多事情,比如度秘就是在 2015 年诞生的。2016 年我的职责范围中又增加了手机百度、Feed 流等重要业务,凭借技术的快速升级,半年的时间里 Feed 的流量就涨了几十倍。
去年 3 月份又回到基础技术的时候,我已经带过百度现在多数最重要的业务。业务中有什么实际应用问题急需解决,业务中产生的什么真实数据可供技术使用,新技术如何融合进原有的庞大系统,我都非常清楚。这些对技术的创新及应用都是非常重要的。
有从做技术到产品再回来负责技术这样一个过程,我会了解基础技术跟产品到底应该是什么样的分工协作关系,怎么样把基础技术做得既领先、前瞻,同时又能更好的支撑业务,不管是支撑现在的还是为未来做储备,都会做得更好。
这期间,你做过哪些现在看起来仍然关键的决定?
如果说最重要的决定,第 1 个是加入百度;第 2 个是除了百度招我时希望我做的自然语言处理,我还把一系列人工智能技术方向都建立了起来;第 3 个是 2014 年初我去负责搜索;第 4 个当然是 2017 年 3 月组建 AIG。
事实上,刚加入百度时,公司并没有要求我把那些 AI 技术方向都建起来。最初进入百度的时候,我的定位就是自然语言处理专家,希望我把百度自然语言处理完善起来。因为搜索引擎对自然语言处理的依赖非常重,比如用户需求分析、网页分析等。但我并未局限于自然语言处理,在我加入百度的第一个季度,就先后为百度开创了机器翻译、语音识别等对当时的百度核心产品价值并不大而后来又证明很重要的技术方向,之后又陆续建立了推荐及个性化、数据挖掘、图像等方向。
2012 年初,又有了很关键的一步,我们正式立项开始做深度学习,这在中国公司里应该说是最领先的。当年,我们基于深度学习的语音、OCR 等系统先后都上线了。从大环境看,那时候我们真正要做深度学习是面临很大挑战的。我记得 2011 年下半年,大家逐渐开始知道深度学习,当时,国内一些做机器学习的顶尖学者举行了一个小型研讨会,会上大家的感觉是,想要把这些技术应用落地还很困难。当时国外有人曾经尝试过将深度学习用于语音识别,训练一次要半年,这种状态是无法大规模产品化的。那时候我也负责做语音,我们和做系统的同事组成联合项目组,既攻关算法,又优化系统实现,半年多的时间就上线了基于深度学习的语音识别系统。
2014 年初,我开始负责搜索,这对我职业生涯是非常重要的一步。要知道,极少有人有机会在自己的职业生涯中,负责年收入数百亿的核心业务。那之后的三年,为公司核心业务做了大量贡献的同时,我自己也得到了非常多的锻炼和成长,也为去年重新负责 AI 基础技术,打造更好更有价值的技术平台奠定了基础。
在你刚加入百度还没有一个明确的职责方向时,还是既做了翻译又做语音这些暂时不太需要的事,是什么驱动你这么做?
我个人的确有兴趣,比如我的前一份工作其实也是负责自然语言处理及语音技术相关工作。但是更重要的是基于两个方面的判断,一方面是产业发展趋势,另一方面是技术发展趋势。以语音为例。
先说产业,虽然当时主流是 PC,但手机已经展现出迅速变强的趋势。所以在我看来,手机迟早会成为主流。而手机是为打电话而生的,人与手机交互最自然的方式就是对着手机说话,这为语音真正广泛应用打下了一个很好的基础,这是对产业的基本判断。
技术方面,过去很多年,语音技术在持续进步,每年错误率都在降低,有时候错误率相对降低 5% 左右,有时候好一点到 10%。积累到 2010 年前后,已经快要到突破的节点了。所谓节点,就是不断提升,过了某个临界点,相应的应用环境成熟,一定会爆发。基于这样一个判断,虽然当时我刚来不久,还是专门跟 Robin 做了一个汇报。他自己也很热爱和支持创新,很认同 AI 技术趋势,所以他很支持,然后就开始做。后来我们做很多事情都是这样的过程。
「要把学术思维和工程思维结合起来,先不管能不能说清楚,管用的就先把它做出来」
这些决策过程容易吗?百度已经是一个体系成熟的大公司。
在百度这个平台上比较容易,百度很看重技术,很鼓励创新,尤其是比较前瞻的技术创新。所以很多技术研究的开始都是如此,大概会有两个基本判断依据,一个技术发展趋势,一个产业趋势,这两个缺一不可。否则,技术做得再好,没有产业需求也没有用;反过来,产业需求有了,技术到不了,突破不了这个临界点,那也无法应用。在这样一个环境下,我们再做判断就不是太难。
一个技术的产业应用临界点,你是怎么判断的?
首先,技术不是说要做到 100% 准确才能用,效果达到一定程度,就好用了。比如语音识别,人也做不到 100% 准确。现在的语音识别技术,很多场景下甚至已经比一个正常人听的准确率还要高,这显然已经可以有很多应用了。我们当时开始研发语音识别技术时候,研究了搜索、地图、输入法等目标应用,分析了语音识别准确率到什么程度可以满足这些应用的需要,结论是努努力是可能做得到的。
所以说,在合适的时机找合适的应用很重要。找应用的想法并不是我首创的,一直就有很多人有这种认识。我们前段时间引入了几位世界顶级的科学家,其中有一位也是研究自然语言的(Kenneth Ward Church)。他比我年纪还要大一些,1993 年我刚入行的时候,就看过他的文章,当时有一篇文章叫 Good Applications for Crummy Machine Translation,那时候机器翻译效果比现在差很多。但即使如此,也可以找到一些合适的应用场景,也能发挥很多作用。
内部在决定要进行或者是开展一项技术的研究,是怎么往前推的?
有两方面,一些是从应用来的,也有一些暂时没有应用。我们看好某些前瞻方向,就会提前布局去做,尤其是越往底层,比如说研究院,不需要有一个直接的应用来牵引,但是我会有一个对未来的预测,认为未来这项技术会很有用,那我们就会提前布局。
你刚才也提到 2011 年下半年国内才开始有人讨论深度学习,具体是什么样的状况?
那时候产业界基本上没人做,学术界基本上也是处于起步的状态,刚刚开始接触和测试深度学习这个概念。我们召开一些研讨会,大家一起讨论讨论到底是怎么回事。所以基本上也没有相应的人才。当时我们要做深度学习,也就是拿一些国外早期发表的几篇 Paper 看一看。Paper 上看不清楚的,就只能自己去摸索了。因为 CPU 训练太慢,我们联合做系统的同事一起搞 GPU。那个时候谁也不懂,就自己想办法搞清楚 GPU 编程到底怎么编,就是这样逐渐做起来的。
在外界这种状态下,百度内部对 AI 或者是对这些细分的技术方向有特别明确吗?
那时候没有那么明确。当时我们建一些技术方向,大家还是从各自产品角度提出有哪些需求,看这些技术是否对产品有用。那时候没人提 AI 这个词,不像现在 AI 已经家喻户晓,我们最初在语音领域做深度学习,公司大多数人还不知道。
其实那时候我自己也在反复思考,深度学习为什么会起作用。我们搞研究特别希望把数学原理先搞清楚,推导出来。深度学习有一些东西,其实在当时看来还说不清楚。所以一定要把学术思维和工程思维结合起来,先不管能不能说清楚,管用的就先把它做出来。
当时有这么一个空间给你不停地去尝试?
这个空间是有的。
2010 年到 2013 年,建立了这些不同的技术方向的部门。这些部门以及这些人,比较大的变化是怎么样的?
部门更成熟了,积累更深厚了。如果说,早期是先把这些基本的技术都搭起来,基础的数据收集起来,能支持一些应用先做起来,现在这些基础已经很强大了。
比如 NLP,NLP 是我来百度之后建立的第一个部门,现在技术、数据及平台的积累都已经很强大了。NLPC 技术平台,每天公司内部的调用量就是千亿规模。在这种情况下,我们一方面持续加强技术平台,另一方面也会为一些重要应用进行定制化技术开发。此外,我们也更有基础去做些更前瞻的、未来的东西,例如通用对话系统、通用人工智能方面的探索。这些看上去离产品应用没那么近,但在百度我们一直有这个追求,再往前多看几步,持续探索通向未来之路。
团队方面,无论是人员能力还是数量,都已经比当年要强很多了。当年那些刚入门的小同学,现在都成顶梁柱了。
转岗去负责搜索相关业务,涉及到的多半是产品,对你来说是挑战吗?
我是技术出身,其实一个纯做技术的人转到业务上,挑战还是很大的。但是我觉得我还是具备做业务所需的一些重要素质的,推动力和执行力都很强。这就是为什么我从纯做技术转到负责业务也能顶得住。
我接手搜索以后,和以前的确是不一样。我记得一开始,Robin 就问我,你怎么保证这个能做好?当时其实压力也挺大的,包括很多竞品追得很紧。我说人家要做,这个我是挡不住的。但是我会保证,我创新的速度更快。因为我技术积累多,我知道做什么会更快,能不断往前跑。这样的话,别人是追不上的,而且别人要一直追着我们,其实最后很容易乱掉他们自己的节奏。
做了一段时间以后,我更坚定了,我发现这样做是有效的,很快就见到效果了。2014 年初,百度搜索引擎虽然局部已经用了不少机器学习技术,但在主体上还是一个传统的、以规则为主的系统。我们迅速地持续不断地推进技术改造,直到现在每个模块都是 AI 技术在支撑。我也发现,用 AI 技术改造搜索的同时,也能衍生出一些其它东西来,这就是后来度秘诞生的原因。
在 2014 年底,我们搜索团队曾做过一次讨论,讨论搜索的未来到底是什么。当时我们就认为,搜索就是不断地满足用户需求,我认为一个比较终极、最自然的状态,其实就是一个像人一样的秘书。比如说你有一个秘书,什么问题,任何事情你跟他交待一句,甚至有一些你不用交待,他很了解你,你什么都不说,他可能就替你办好了。这就是为什么后来会有度秘,会有小度机器人。相当于做搜索这条主线的同时,衍生出了面向未来的旁线开始做。
「AI 会渗透到各行各业,会渗透到我们生活的方方面面,社会的每一个角落都会有」
在具体场景里,什么样的产品才是好的 AI 产品?它能更好地把技术和用户体验结合起来。
AI 产品已经真实存在了。搜索引擎就是一个典型的,而且是一个最大的 AI 产品,规模极其庞大,里面有大量的 AI 技术。我们做的几乎所有的 AI 技术都会用在搜索引擎里,所以搜索引擎和以前相比也变得越来越不一样。
度秘、无人车更典型了,它们和搜索引擎不一样。搜索引擎诞生的时候,人们并不把它看作是 AI 产品,后来我们把它逐渐演化成这样了。而度秘和无人车从诞生的那一天起,就被认为是 AI 产品。信息流背后也是 AI 技术,要对用户进行理解,对内容进行理解,将内容和用户做匹配进行个性化推荐,所有这些事情都是 AI。
领取专属 10元无门槛券
私享最新 技术干货