2020年7月9日,世界人工智能大会云端峰会以“智联世界 共同家园”为主题,以“高端化、国际化、专业化、市场化、智能化”为特色,集聚全球智能领域最具影响力的科学家和企业家,以及相关政府的领导人,围绕智能领域的技术前沿、产业趋势和热点问题发表演讲和进行高端对话。会上,图灵奖获得者、中国科学院院士姚期智与我们分享了主题为“人工智能理论的新方向”的演讲,他表示,AI已经不是一个新的概念,其已经发展了很多年。
内容未经本人确认,由 InfoQ 依据现场视频进行整理,以下为姚期智的演讲全文整理。
姚期智教授传递了对于AI的三个观点:第一、AI理论十分重要。如果回顾下AI发展中面对的困难和挑战,从AI理论方面考虑,我们至少能知道所面临的困难是什么,也就有了如何解决问题的思路;第二、AI的发展需要共同的智慧,人工智能绝对是一个跨学科的行业。有许多例证可以表明,在AI方面获得的一些巨大成果往往是因为一些看似完全不搭界学科之间的合作,这可能需要几十年的努力,因为没有其他学科科学家所取得的研究成果的话,在AI方面我们是不可能取得这么快的发展。第三点、希望通过一些例子,告诉大家一些非常有意思、值得探索的新方向。
深度学习的成功某种意义上说是令人吃惊的,因为它已经沉寂了很多年,我们也在思考深度学习的力量缘何而来,背后有哪些支撑?如果我们能了解为何神经网络会取得成功,或许就能知道该如何来提升以及从哪些方面来找到突破口。
正如李彦宏教授谈到的,深度学习和神经网络是很多应用程序的基础。姚期智教授在这里要谈到了几个机器学习从业者比较感兴趣的理论问题,其中包括神经拓扑结构:神经网络研究的新视角、隐私保护学习,人工智能+多方计算;可控的超级人工智能:如何设计有益的超级智能?
姚期智教授举了三个例子,对以上提出的问题进行了讲解:
第一个例子他谈到机器学习和拓扑学之间的联系,是数学非常有意思的分支。第二个例子是关于人工智能和隐私之间的关系,就是密码学,这是AI一个全新的领域。第三个例子是一个很多人非常感兴趣但也充满争议的话题,就是可控的超级人工——Super AI,人们比较担心的是AI快速进展可能会带来对于人类社会的威胁。
下图是一个波动的数据。假设有一个算法来分析气候,到底是风暴还是正常现象,一个比较标准的方法就是会看一张图把它看成二维或者三维,希望从中找到范式,看一下这张图是不是符合一个风暴的特点。在深度学习或者最近的机器学习)当中,人们可能从更高层次、角度来看,整张图应该被认为是一个高维度的点,一个高维的数据。比如看一张猫的图片,可能包括几百万个像素,可以被代表成一个一百万维的一个点,这就是AI标准机器学习的方式。我们如何来分析一个内容?比如给到一个数据它是一个点,但是是一个极高维度的点,我们去分析这个点是不是属于一个数据集,这个数据集就叫猫的图象。
抽象来讲,大家可以看一下所有猫的图片,它是一百万维度的一个子集,没有人知道在高维度当中的数据集是什么样,可能对于低维度数据是有感觉的,在高维度空间当中有很多非常有意思的洞见。所以,在神经网络这样计算网络当中,核心的问题就是神经网络要达到什么样的大小和深度,才可以区分一个猫的图片和一个其他非猫的图片。
在高维度情况下,数学家一直在关注高维度数据集,而且关注了很多年。一个自然的问题就是如果人们去了解神经网络能做什么,我们想要知道什么样的数据集是神经网络比较容易去识别的,以及什么样的数据集是我们不能用神经网络来解决这样问题的。在过去10年当中,神经网络方面的专家开始这样去思考。事实上,我们也看到这方面的一些结果,就是把一些数学和神经网络的能力联系起来,然后做计算。
在拓扑学当中一个非常重要的概念是应用于高维度子集或者任何维度的子集叫贝蒂数,最低的是b0,等于一个子集当中不相关的元素数,而b1你可以认为它代表着子集当中有多少个洞,平面有一个圆圈b0等于1就是有一个元素,b1也等于1,中间是个洞。看更复杂的案例一个环面,像一个圈圈饼一样。b1一维洞的数量等于2,有两个不同类型的圆圈,每个圆圈代表一个洞。如果这些数字集合在一起,这个数列就叫做总的贝蒂数,数学角度看到它就说一个数据集在高维度领域有多大复杂性,会让我们可以猜测过去10年一直考虑的问题。
如果一个数据集是非常复杂的,对于神经网络来讲就更难识别。这也给了我们一个灵感,要解决AI问题,不妨从另外一个学科角度来考虑这个问题,这个案例当中讲的就是拓扑学。拓扑学方面的一些概念、技术和复杂度的理论可以让我们获得一种AI方面新的理论,只看AI是不可能的。
第二个例子,关于隐私的保护。姚期智教授表示他本人对密码学非常感兴趣,特别是MPC,假定有很多不同的当事方,每个方面都有一些数据,你需要各方面数据结合在一起才能够通过AI挖掘到一些重要的结果,但是所有当事方所拥有的数据是秘密的,而且是非常有价值的,他们不希望把自己的秘密给到第三方知道。
那我们是不是可以这样做,让计算的结果不需要去揭秘这个数据属于谁,甚至不必要揭秘这个数据,是否可以通过多方密码做法来实现这个结果?姚期智教授认为,其实可以通过密码学实现这个目标。
密码学的技术很早就已经开发出来了,当时应用得非常少,但那么多年之后,成本已大大下降,现行技术让我们有了实现的可能。
最后一点,很多人担心是不是会出现超级人工智能。我们不知道超级人工智能会不会出现,但是伯克利大学的一位教授去年有一本书,讲了一个非常有意思的概念。他说,“尽管我们不知道超级人工智能会不会来,但是我们最好做好准备。他提出了一些很好的方法论,让大家用一些非常具体的方法做好准备。”
最后,姚期智教授向大家传递出一个基本概念就是——现在的应用来自于过去的理论研究和所做的理论研究在未来某一天会让我们获得巨大的进步。
领取专属 10元无门槛券
私享最新 技术干货