【新智元导读】 深度学习火热的背后,也带来了对神经网络自身能力的质疑,特别是被人诟病的“黑箱”问题。本文介绍了一些通过不同于深度学习的路径实现 AI 的公司,强调贝叶斯理论的重要性,指出非确定性和高斯过程在人工智能的发展中其实扮演着重要角色。在作者的介绍中,Uber 似乎是最痴迷高斯过程的一家高科技企业。
在硅谷,神经网络十分流行,它带来了种类繁多的互联网服务和众多形式的人工智能。但是,神经网络再好,能做的可能也不过是从你的线上相册中识别出猫来。AI 研究者知道,神经网络目前依然有很大的缺陷,并且缺陷如此之多,使得一些人开始怀疑,这样的模式识别系统是否真的是通往更加先进的、更加可靠的 AI 的可行之道。
通过分析大量的数据获得的学习能力,神经网络能够处理大量的任务,从 Facebook 的图像识别到微软的翻译,再到谷歌的互联网搜索。
神经网络也开始帮助聊天机器人学习交谈的艺术。并且,它们也是无人驾驶汽车和其他自动化机器的社会运动的一个重要组成部分。但是,由于如果缺乏大量的、经过仔细标注的数据,神经网络对整个世界是一无所知的,所以它们也不是对任何事物都适用。此外,AI 研究者对于神经网络所做的某个决策背后的原理的了解也非常有限。从很多方面看,神经网络都是黑箱。这种不透明性可能会引起严重的问题:如果无人驾驶撞到了人,大家都想知道为什么的时候,该怎么办?
Tuomas Sandholm
“深度学习确实获得了大量的关注,这是它应得的”,卡内基梅隆大学计算机科学系教授Tuomas Sandholm 说。Tuomas 帮助开发了最近在德州扑克比赛中赢过人类玩家的计算机程序 Libratus。他们没有使用深度学习的方法。
“但是,深度学习并不能给你任何保证。”
这没错。由于神经网络中这些显而易见的弱点,从招聘、并购和研究三个方面来看,世界上最大的几家科技公司中,有一些已经开始拓宽它们对人工智能的思考方式,不少初创企业也在遵循相同的发展道路。你可以认为这是贝叶斯的觉醒,研究者通过科学的方法(即,从一个假设开始,根据数据来不断地更新这一假设)去实现 AI,而不是仅仅依赖数据来获得结论,正如神经网络那样。贝叶斯理论希望做的是通过在既有模型中填充新的证据,去做那些神经网络并不擅长的事,寻找到处理不确定性的方法。
和神经网络一样,贝叶斯方法可以从数据中进行学习,但这种机器学习采取的是完全不同的方法。 “我们感兴趣的是将科学的方法自动化,” AI 创业公司 Gamalon 的创始人Ben Vigoda说。这家公司通过一种称为概率编程的技术在这个方向上前进。
另一个值得注意的是,神经网络的快速崛起与其他技术结合,可以帮助机器变得更聪明,从强化学习到进化计算(evolutionary computation)。机器学习的方法可以有很多种。
神秘的技术
去年12月,Gary Marcus 将自己只有15个人的初创企业卖给 Uber 时,他实现了一种新的人工智能。至少他是这么说的。
他的公司此前叫 Geometric Intelligence(几何智能),意思是,只要一点小的改动就可能会产生大的影响。这位47岁的纽约大学心理学教授说,他和同事正在开发只需要非常小的数据就可以学习的系统,正如人类所做的那样。这一系统可能会超越深度学习所具备的能力。
Marcu 认为,小数据系统对于可以自主完成对话的机器人,或者自己能在公路上驾驶的汽车来说是一个关键。“在语言和无人驾驶领域,有一些问题是你绝不可能会有足够的数据,仅仅使用暴力算法就可以解决的,像深度学习一样。他在 Uber 收购 Geometric Intelligence 时说。毕竟,你不能让一辆无人驾驶车开到繁华的街道上去搜集关于如何避免事故的数据。“你买不到(这些数据),它们也根本不存在”,Marcu说。
Marcus 和公司的另一位联合创始人、剑桥大学信息工程系教授 Zoubin Ghahramani 目前仍不愿意讨论他们在开发的系统。这是技术领域常见的事,特别是AI 的研究中,这种神秘感创造了一种魔力般的感觉。但是,Ghahramani 也是贝叶斯主义者。他是高斯过程(Gaussian process)的研究专家,这种技术很可能在他和 Marcus 所开发的人工智能系统中扮演着重要的角色。
高斯过程
一方面,一个高斯过程,就是为确定的问题寻找最优解决方案的方法。这为另一个数学方法——贝叶斯最优奠定了基础。高斯过程已经被一些网站用于决定该显示哪些广告,或者主页看起来应该是怎么样的。Uber 已经聘请了一些专门研究高斯过程的专家,用于提升叫车服务。在谷歌,高斯过程已经被用于控制该公司的高纬度互联网气球。
从根本上看,高斯过程是一个用于发现非确定性的好方法。“知道未知的是一件很好的事”,爱丁堡大学的 AI 研究员 Chris Williams 说。Chris 是高斯过程和机器学习著作的联合作者。他说: “遇到置信错误(confident error)的问题是最糟糕的。”
Whetlab 是一家被 Twitter 于2015年收购的创业公司,在这家公司中,高斯过程提供了比设计神经网络更好的方法。设计一个神经网络是一个包含了极端试错的任务。
Adam 左一
你对一个软件的编码,不再是从数据的海洋中捞取结果,因为这是一个困难和耗时的任务。高斯过程和贝叶斯优化可以帮助自动完成任务。正如 WhetLab 的创始人、哈佛计算机科学家 Ryan Adams 所说的,该公司使用“机器学习来改进机器学习”。神经网络可能会遇到“置信错误”问题,在识别不确定性时,这种优化可以帮助解决这个问题。
Adams 已经离开 Twitter,加入了谷歌大脑。
一些研究者也认为,高斯过程带来的小数据的能力在实现自动化的 AI 上扮演了重要的角色。“要打造一个真正自动化的智能体,它们必须要能够快速地适应环境”, AI 初创企业 Prowler 的 CEO Vishal Chatrath 说。他和 Ghahramani 是同事。
“这意味着能以最高效的方法利用数据进行学习”,Chatrath 说。另外,高斯过程很容易理解。和神经网络不同,他们不受限于黑箱问题。如果发生事故,你可以追踪到根本原因。
不要惊慌
在 Prowler,Chatrath 招了三名有这一技术特长的学术研究员。这家公司的总部位于剑桥大学,这里同时也是 Ghahramani 和其他一些高斯过程和相关技术专家的大本营。这家公司正在开发能够在有大量玩家参与和其他数字世界中进行导航的 AI 系统。这是一项复杂的工作,但是他们希望能更进一步,开发出能在现实世界中导航的系统。
同时,亚马逊最近也聘请了一些擅长贝叶斯技术的AI 研究者,其中包括谢菲尔德大学的计算机科学家 Neil Lawrence。“不要惊慌”,Lawrence 最近在一篇博客中写道,“通过把我们的数学工具加入到新的深度学习浪潮中,我们可以保证,它们大部分都是无害的。”
原文:https://www.wired.com/2017/02/ai-learn-like-humans-little-uncertainty/