首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >百度IDL主任林元庆解读:人工智能技术研发的四大支柱

百度IDL主任林元庆解读:人工智能技术研发的四大支柱

作者头像
AI科技评论
发布于 2018-03-09 03:34:10
发布于 2018-03-09 03:34:10
1.3K1
举报
文章被收录于专栏:AI科技评论AI科技评论

近日,百度深度学习实验室主任林元庆在百度年终媒体分享会上做了《看懂AI-百度技术开放日》的演讲,从客观层面阐述了人工智能技术研发的四大支柱,为我们呈现了让人工智能更深层,更极致的方法论,下面是演讲精华摘要。

人工智能有三大要素,就是前面我们看到的机器学习算法大数据,大规模计算。但这里我们特别要强调一个要素——大应用。人工智能领域真正要做到极致,很深地去解决一些问题,就需要加上大应用这个要素。

机器学习算法

下面先讲第一个要素,机器学习算法,这里我们重点要讲的是深度学习。百度深度学习实验室旗下目前正在做的有10个大方向,都跟深度学习和计算机视觉相关。

  • Paddle Paddle(深度学习平台。早在2013年就开始研发。)
  • 图像检索
  • 通用图像技术(包括物体检测和图像分割
  • 人脸识别
  • OCR文字识别
  • 视频分析
  • Learning Robot
  • 细粒度图像识别
  • 医学图像分析
  • AR

下面以深度学习做机器翻译为例,这是一个非常有名的机器翻译的数据,这是英语到法语中的测试结果,在用我们的方法做之前,大家的方法很少能把机器翻译BLEU评测值做到37.7的,我们去年开始用深度学习方法后,第一次用深度学习方法做出了这个专家系统,是目前为止最深的NMT模型。

大规模计算

大数据这里我们要讲的是,大规模计算。

我们正在做的一件事情,是要把我们的计算环境开源,下面是我们已经在部署的一个非常大GPU BOX,现在商用的GPU BOX基本上是4块到8块,但这样的话,机器跟机器之间的并行,不会那么高效,所以我们弄了可容纳多达128块GPU的GPU BOX,现在我们准备开放出来,给工业界,给高校都感受到这个大规模计算的能力。

大数据

我们需要很多大数据。人工智能的研发轨迹,经过一个比较久的储备后,在经过了前期技术和早期应用之后,它会有一个非常非常快的上升期,然后这个上升期的重要性,大家可以理解成一个正循环——数据,技术,产品,用户,更多数据,更强的技术——有了产品,有了用户去用,就会产生更多的数据,有了更多数据之后,就会有更强的技术,因此人工智能研发轨迹其实是一个非常重要的正循环。

大应用

这里要总结的是,AI要做到极致,必须有大应用。以人脸闸机为例,乌镇互联网大会上的闸机,20台人脸注册终端,实现了乌镇景区年流量近千万游客的多次入园需求,站在追求大应用的维度上,虽然我们不是第一个做人脸闸机的,但我们可以成为这个行业真正的改变者。

总结:

前面我也有说道,人工智能有三大要素,就是前面我们看到的机器学习算法,大数据,大规模计算。但这里我们特别要强调一个要素——大应用。人工智能领域真正要做到极致,很深地去解决一些问题,就需要加上大应用这个要素。

附:在今年 10 月的 IROS 2016 年大会期间,雷锋网采访了百度深度学习实验室主任林元庆:就 IROS、开源平台、AI眼下最重要的事情等问题进行访谈,以下是采访全文。

雷锋网:此行来IROS的目的?

IROS是世界上最大的关于Robitics的国际会议之一,大会的Plenary talk是会议众多演讲的重中之重。虽然平时我很少在外面公开做演讲,但这样一个学术性的talk既然主动邀请,就过来了,另外这也是向世界的Robotics研究人员介绍百度人工智能的好机会。

雷锋网:作为一个机器人会议中受邀的AI演讲者,机器人中需要用到AI的地方,可以概括一下?

很多,像我刚刚说的百度大脑里面,有语音识别,计算机视觉,NLP,推荐/预测,运动/控制,决策/规划,这几个AI大方向都是机器人学的重要基础技术。

雷锋网:CPU+FPGA,CPU+GPU组合更看好哪个?百度不同业务去分配的时候是如何决定用哪个组合的?

这两个技术都在进步,我们没有一个预设的立场,百度这两个方向都在应用。选择上,百度不同业务,训练阶段大部分用的大部分是GPU,testing阶段有用GPU,也有用FPGA的,更成熟的业务可能会选择FPGA,这样优化的空间会更大一些。

(看你刚刚放的PPT划分的百度AI相关业务,这些业务用哪个组合会有明确的选择吗?)

这个很难讲,人工智能不是单个技术,而是包含很多很多的不同技术,以计算机视觉为例,它就有图像分类,物体检测,图像分割等不同技术。GPU和FPGA对不同的任务,可能各有优缺点。

(就是一项业务训练的时候用的GPU,实际应用的时候可能转到FPGA?)

对,是这样。

雷锋网:现在ImageNet比赛结果对工业界的意义在哪里?

这几年ImageNet的竞赛涌现出一些非常有用的算法,比如AlexNet之后的GoogleNet, VGG, ResNet等,对工业界的技术性能的提高,有很大的推动作用。ImageNet一个很大的意义是在于推动算法的革新。这对工业界和学术界,都是非常有意义的。

同时,工业界打造的产品,常常需要go beyond ImageNet。我记得第一年(2010年)ImageNet比赛我们拿了第一名。我是当时项目的负责人。但之后我们发现ImageNet的结果很难直接用在产品上。我们后来开始主攻细粒度图像识别。百度糯米这个月下旬将推出一个非常重要的功能,其中的一个重要技术就是菜品图像的细粒度识别(识别图片里的菜品是哪个餐馆的哪道菜)。即使是通用的图像分类,百度的图像库有接近1亿张带类别标签的图片,比ImageNet Challenge(150万张图片)的大很多。我们内部的数据要比公开的数据大很多,需要更好地反应我们要解决的问题。

雷锋网:你现在领导的十个业务都跟之前主攻方向之一大规模细粒度图像识别有何关系?

对,有很多关联的。最直接的当然是细粒度图像识别方向。我们希望在百度搭建一个非常强大的细粒度图像识别的研发团队。其它的项目与这也有关联。比如人脸识别就是一个最经典的细粒度图像识别任务。很多技术是相通的。还比如我们的医学图像分析,它的很多做法与细粒度图像识别也有相通之处。

我们现在强调做instance-level的细粒度图像识别。比如,我们身下坐的这把椅子,我们不单单只是识别这是一把椅子,我们还需要识别出这是哪个厂家哪个型号的椅子。还比如前面提到的“哪个餐馆哪道菜”的识别。这些都是非常精细的识别。这些问题当然都很难,需要投入很大的研发力量。但应用前景是非常大的。

雷锋网:跟之前NEC的工作有什么内在联系?

NEC美国实验室在美国是非常优秀的实验室,也在AI上做了非常多的工作。我也非常幸运地在那里做了7年半的研究,包括最后三年多作为实验室媒体分析部门的负责人。当时的工作与现在的工作一脉相承。

雷锋网:刚在演讲最后,你讲到AI大幕已启,接下来让它走地更远的话,最重要的一步是什么?

最重要的一步是要有用,能解决实际问题,真正能解决一些很重要的问题。比如自动驾驶,那就是要真正能上路。人脸识别,就是什么情况下人脸识别都能识别得非常精准。

雷锋网:作为过来人分享一下,学生选Robotics专业的时候要注意什么?

机器人,包括AI,大家可能会有一些误解,觉得这是单一技术,但其实它涵盖的技术非常复杂,而一个人是很难去解决所有的技术的。像今天第一个talk讲的机器手抓取,从应用角度来看这是一个非常特定的领域,但这个方向做学问的话你都可以做很久。

我个人的倾向是注意不要大而全,要根据自身的兴趣和特长定一些侧重点。我经常会跟我身边的人说,要认准一个方向,做到这个方向的Mr. something,比如Mr. fine-grained image recognition。这样你的事业可能就越走越宽。

雷锋网:作为一个AI参与者,前不久余凯发了一个声明:“一直以来我非常钦佩谷歌的Jeff Dean在MapReduce和谷歌大脑(TensorFlow)等项目上的杰出成就。但是,我必须指出,放任TensorFlow成为世界上占统治地位的人工智能开发平台对世界是危险的。……” 如何看这个观点?

AI的平台很重要,确实需要多样化的选择,上次我也回了他朋友圈,认为我们这一代人应该团结起来,推动深度学习平台的开放和多样化。百度现在有PaddlePaddle深度学习平台,这个其实是百度花了非常大的资源做的一个平台,现在开源了,希望能在中国人工智能领域贡献一些我们的力量。

雷锋网:之前PC时代,Windows出现了就有Mac OS,还有Linux; 移动互联网时代,iOS出现了就有Android;从来没有一家独大的时候,会不会AI平台也不用担心?

还是不太一样。很多AI技术有一个正循环效应,越多的人来用,你的系统越好,这样会吸引越多的人来用。你已经快速迭代了甚至已经做到极致了,别人再去重新开始一个,难度是比较高的。

小结:

林元庆在演讲的过程中,以及会后采访的过程中,一直在强调AI大幕“已经启动”这个关键动作,虽然“人工智能”这个概念最早从1955年8月31日就开始提出,但从当时的诞生,到中间的两起两落,一直像个蹒跚学步的孩子一样经历了60年才迎来了第三次复兴的浪潮。

1956年到1974年,全球第一次人工智能浪潮出现。 1974年到1980年。第一次人工智能冬天出现。 80年代出现了人工智能数学模型方面的重大发明,第二次浪潮出现。 1987年到1993年现代PC的出现,让人工智能的寒冬再次降临。

不过这一次,随着硬件,数据,算法三板斧的默契配合和发展,AlphaGo与世界顶级围棋高手李世石的人机世纪对战,人工智能已经从基本的语音识别,图像识别,向着自动驾驶,视频,AR,医疗,金融等各种领域无声地渗透,也引发了全民关注AI复兴的热潮。

老骥伏枥,志在千里。如果说过去60年是它从孕育到踌躇的“蹒跚”周期,那往后60年,将会是它揭开“无穷大”大幕的周期。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2016-12-13,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI科技评论 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
1 条评论
热度
最新
不错
不错
回复回复点赞举报
推荐阅读
编辑精选文章
换一批
告别Git恐惧症!一套课程搞定Win/Mac/Linux三端配置与核心原理
Git 配置级别:本地、全局、系统 ,本地优先级大于全局 ,全局大于系统 (local > global > system) 。
stark张宇
2025/10/09
1650
10.2 Git 内部原理 - Git 对象
Git 是一个内容寻址文件系统。 看起来很酷, 但这是什么意思呢? 这意味着,Git 的核心部分是一个简单的键值对数据库(key-value data store)。 你可以向该数据库插入任意类型的内容,它会返回一个键值,通过该键值可以在任意时刻再次检索(retrieve)该内容。 可以通过底层命令 hash-object 来演示上述效果——该命令可将任意数据保存于 .git 目录,并返回相应的键值。 首先,我们需要初始化一个新的 Git 版本库,并确认 objects 目录为空:
shaonbean
2019/05/26
8620
git底层原理,从常见操作解释git的底层原理,再也不怯
每个开发者拥有自己仓库的写权限和其他所有人仓库的读权限。这种情形下通常会有个代表“官方”项目的权威的仓库。
公众号 IT老哥
2021/01/12
3K0
洞悉技术的本质-Git内部原理探索
洞悉技术的本质,可以让我们在层出不穷的框架面前仍能泰然处之。用了那么久的 Git,不懂点内部原理,那可不行!懂点原理可以让我们遇到问题的时候能够更好更快的理清解决问题的思路。
Cloud-Cloudys
2020/07/06
9150
Git 原理入门
即使天天使用它,很多人也未必了解它的原理。Git 为什么可以管理版本?git add、git commit这些基本命令,到底在做什么,你说得清楚吗?
ruanyf
2018/10/11
7800
Git 原理入门
这才是真正的Git——Git内部原理
linux 之父 Linus Torvalds 大家应该都知道,而 git 也是由 Linus 开发的。从 1991 年发布了第一版的 linux 内核,Linux 内核开源项目有着众多的参与者,但绝大多数的 Linux 内核维护工作都花在了提交补丁和保存归档的繁琐事务上(1991-2002年间)。到 2002 年,整个项目组开始启用一个专有的分布式版本控制系统 BitKeeper 来管理和维护代码,之前市面上也有其他的版本管理系统,比如 CSV、SVN,但是 Linus 觉得它们很蠢,直到有了 BitKeeper 才开始使用版本管理系统。
前端森林
2021/06/25
3.2K0
这才是真正的Git——Git内部原理
用了5年的Git,你竟然还不晓得它的实现原理!
作者 | 杨夕 来源 | https://zhuanlan.zhihu.com/p/53750883 越了解事物的本质就越接近真相。我发现学习Git内部是如何工作的以及Git的内部数据结构这部分内容,对于理解Git的用途和强大至关重要。若你理解了Git的思想和基本工作原理,用起来就会知其所以然,游刃有余。这是Git系列的第一篇,主要会介绍Git的特点以及内部数据结构设计,和完成一次完整提交流程的时候数据是如何变化的。 Git有什么特点? fast,scalable,distributed revision
程序猿DD
2023/04/04
3930
用了5年的Git,你竟然还不晓得它的实现原理!
我们随手做的 git stash,究竟干了什么?
git stash 是程序员的至宝。老板 biangbiang 甩来一个 case,说这个要下班之前 hot fix,咋办,stash,切到 release 对应的分支,缝缝补补;产品 kuangkuang 砸来一个需求更新,说这个简单,小哥哥帮帮我先做了,咋办,stash 切一个新的 feature 分支,撸袖子干。如果没有 git stash,人生至少要灰暗一半。
tyrchen
2019/12/02
5790
从一个实战的角度来理解 Git 原理~
我之前写了一篇文章 《深入理解 Git 》https://zhuanlan.zhihu.com/p/71577255。
DevOps时代
2020/11/03
6780
从一个实战的角度来理解 Git 原理~
一篇搞懂Git 和 SVN 的区别【原理篇】
Git和SVN都是版本管理系统,但是他们 命令区别后面会简单进行一个对比,我们先从原理的角度分析
火狼1
2022/03/22
5.5K0
一篇搞懂Git 和 SVN 的区别【原理篇】
10.6 Git 内部原理 - 传输协议
Git 可以通过两种主要的方式在版本库之间传输数据:“哑(dumb)”协议和“智能(smart)”协议。 本节将会带你快速浏览这两种协议的运作方式。
shaonbean
2019/05/26
9000
10.4 Git 内部原理 - 包文件
让我们重新回到示例 Git 版本库的对象数据库。 目前为止,可以看到有 11 个对象——4 个数据对象、3 个树对象、3 个提交对象和 1 个标签对象:
shaonbean
2019/05/26
5160
Git原理入门简析
Git 是当前流行的分布式版本控制管理工具,最初由 Linux Torvalds (Linux 之父) 创造,于 2005 年发布。
我没有三颗心脏
2019/08/19
5020
通俗易懂的 Git 教程:核心概念
Git 是目前世界上最优秀的分布式版本控制系统。版本控制系统是能够随着时间的推进记录一系列文件的变化以便于你以后想要的退回到某个版本的系统。版本控制系统分为三大类:本地版本控制系统,集中式版本控制系统和分布式版本控制系统
用户4962466
2019/10/17
6260
Git目录为什么这么大
本文围绕git的目录过大,从git进行版本控制底层存储出发,简要分析Git目录过大的原因,以及如何处理
仙人技术
2021/08/31
1.5K0
Git目录为什么这么大
Git Pro深入浅出(三)
前面已经阐述了Git基本的运作机制和使用方式,介绍了许多Git提供的工具来帮助你简单且有效地使用它。本部分将演示如何借助Git的一些重要的配置方法和钩子机制,来满足自定义的需求。
奋飛
2019/08/15
1K0
【Git#1】初识 git(配置 & 基本认识 & 文件操作)
在工作或学习时经常遇到这样的情况:我们在编写各种文档时,为了防止文档丢失,更改失误,失误后能恢复到原来的版本,不得不复制出一个副本,比如:
IsLand1314
2025/04/19
4670
【Git#1】初识 git(配置 & 基本认识 & 文件操作)
Git的存储原理
Git 出现前,主流版本控制系统(SVN...)一般为基于增量(delta-based)的系统,如下图:
小江的学习日记
2024/07/27
3350
聊聊Git原理
说起Git,相信大家都很熟悉了,毕竟作为程序猿,每天的业余时间除了吃饭睡觉就是逛一下全世界最大的开(tong)源(xing)代(jiao)码(you)网站GitHub了。在那里Git是每个人所要具备的最基本的技能。今天我们不聊Git的基本应用,来聊一聊Git的原理。<!-- more -->
Jackeyzhe
2020/03/11
4410
.git 目录的内部结构
本篇不是讲git的使用,也不是讲git的源码,但阅读本篇有助于理解git的底层逻辑设计。本篇讲的是一个文件夹,具体就是git分布式仓库中的本地仓库的隐藏文件夹.git。
后端云
2023/02/10
9090
.git 目录的内部结构
相关推荐
告别Git恐惧症!一套课程搞定Win/Mac/Linux三端配置与核心原理
更多 >
交个朋友
加入腾讯云官网粉丝站
双11活动抢先看 更有社群专属礼券掉落
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档