在人工智能领域大牛在西班牙NIPS会议酒店吃早餐的时候,Open AI 宣布开源了其新平台“宇宙”(Universe)。这家由伊隆·马斯克资助的非赢利性AI开源组织,在周一的上午搞了个大新闻,相信NIPS的餐桌上一定热闹非凡。当然,Open AI后续也在NIPS的会场展示了自己的成果。
Open AI 联合创始人Greg Brockman 在Twitter上说道,“这个AI 训练架构,是我们从Open AI建立之初就在计划着的”。可见Open AI对这个平台的重视。
那么这个敢以“宇宙”命名的 Universe是个什么东西呢?
OpenAI官网的介绍是:Universe软件平台,通过全世界的游戏、网页和其它应用,来测量和训练AI的普通智力。
在Universe上,AI智能体像人一样使用电脑:观看视频,并操作键盘和鼠标(只不过是虚拟的)。总而言是:人类可以在网络上做的事情,Universe都可以让AI智能体经历一遍,目的就是训练智能体掌握类似于人类的“普通智力”。
如今的AI技术,已经使计算机能看、能听和翻译,还能产生图像、声音和文本,AlphaGo甚至击败了李世石。
但是如今的AI技术仍然逃脱不了“窄AI”的范畴,也就是说,它可以在某一个特定领域达到超强表现,但是一旦超过这个领域,就无法工作。AlphaGo能在围棋上轻松赢过任何人,但是没法去玩其他的棋类游戏。
而Universe平台,就是为了打破“窄AI”的樊篱而诞生的。其核心架构由 Greg Brockman, Catherine Olsson和Alex Ray三人一起建构。
OpenAI创始人Ilya Sutskever在接受《连线》采访时说道:“一个AI智能体就是应该能够解决你扔给它的任何问题。”这听起来有点过于大胆了,甚至有点“天方夜谭”。但Sutskever将Universe与ImageNet作类比,他认为ImageNet帮助计算机能够像人一样地“看见”,如今谷歌和Facebook的众多app已经可以做到这一点了,而Universe要做的,就是将人工智能朝向每一个维度扩展。
早在今年4月,OpenAI 发布了一个名为Gym的工具包,用来开发和比较增强学习算法,包括了众多训练环境(Environments)。如今在Universe上,任何一个程序都可以转变成一个Gym环境。
今天发布的Universe,可以在1000多个环境里运行,包括Flash 游戏、浏览器任务等。Universe 搞定了 Valve 和 Microsoft这样的游戏巨头,获得了游戏授权。
(Universe平台的部分合作方)
其实在游戏里训练智能体不是新鲜事儿,因为游戏的内容是可控的,有清晰的奖惩机制,所以智能体在其中可以稳定地学习什么可以做,什么不可以做。比如加拿大阿尔伯塔大学提供了经典游戏Atari的学习环境,微软则基于Minecraft游戏打造了Malmo系统。
可以说,从训练智能体这一点来看,视频游戏已经给真实世界带来了积极的影响。
不过相比而言,Universe不仅可以在众多游戏环境里,还能在浏览器任务等任何网络环境里运行,其覆盖面超过了以往任何同类系统。
DeepMind之前建立了一个可以在Atari游戏里训练的智能体,并使用相似的技术来对谷歌全球数据中心网络进行精细化训练,以此来节省每年数百万美金的成本支出。
Craig Quiter目前是Otto公司的工程师,这家自动驾驶卡车公司今年夏天被Uber收购。 在任职Otto之前,Quiter曾参与过Universe的开发工作,由于此前对该平台早已熟悉,他对 Universe“省钱”的功能兴致勃勃,正在打造一个可以玩“侠盗猎车手V”游戏的智能体。
目前Otto的自动驾驶系统可以在相对平稳的环境下运行,但是在未来几年,该公司希望可以随时对路上遭遇的恶劣状况做出反应,而“侠盗猎车手V”里此起彼伏的惊险车况,对于Otto的自动驾驶系统是个很好的训练素材。
Sutskever表示,在长期看来,Universe平台以后甚至可以用于“迁移学习”:智能体把一个场景中学到的东西应用到另一个场景。他表示目前已经在着手建立一些智能体,将一个赛车游戏里学到的东西,应用在新的游戏里。