由 Craig Quite 的 DeepDrive 项目搭建和维护的、加入了 Grand Theft Auto V 的 Universe(OpenAI 的人工智能训练平台)现在开源了。
要使用这一平台,你将只需要购买一个复制版的 GTA V,然后你的 Universe 代理将能够在一个高保真度的虚拟环境中开始加速汽车上路。
在 Universe 中,GTA V 能让AI 代理进入一个丰富的 3D 世界。下面这段视频展示了,喂给代理的帧(人工减速到8FP,左上),对代理的诊断以及环境(左下),以及人性化的自由摄像头视角(右)。在 GTA V 中,用于纠偏的人类行为都是非暴力(non-violent)的。
本次开源发布的内容包括:
集成以上两者能够支持选择摄像机和视场偏移,还包括通过强化学习训练实现奖赏功能,能够让代理学会避免碰撞,计算目的地距离和停留在路上。
现在,游戏能够在云中的Windows虚拟机上运行,并通过 websockets 和 VNC 与 Universe 通信。因此,Universe 代理可以在 Linux 或 Mac 上运行,并且可以在任何 ML 框架中编写。
GTA V 给研究人员提供了一个用于测试和开发 AI丰 富多样的世界。GTA V 的岛屿设置几乎相当于五分之一个洛杉矶,还可以访问各种场景来测试系统。除此之外,系统提供 257 种不同的汽车、7 种类型的自行车和 14 种天气,在单个模拟器里使用这些数据进行排列组合,可以实现大量不同的虚拟场景。
至于这次发布版本中包括的基础代理,是通过模仿学习 21 小时(约 60 万图像)游戏画面进行驾驶训练的 AI (内置的游戏 AI 是很好的初始目标:它的性能优于一个典型的人,因为它可以访问内部游戏状态,虽然 AI 仍然会犯错误,如在高速公路上进行U转弯)。基准代理可以驱动各种不同的天气条件,对交通作出反应并保持其车道。
OpenAI 研究员表示,这个预训练代理只是一个开始,他们邀请全球开发人员一起改进这个代理。
GTA V 与 Universe的集成自动继承了 Universe 为了可比性和共享性而提供的所有工具和语义,能够很简单地对 GTA V 上的代理进行性能基准测试。Universe+GAT V 可以单独使用,也可以作为使用 Universe 代理访问的一个环境。
了解更多:https://openai.com/blog/GTA-V-plus-Universe/