虽然机器人的灵活性还没有达到接近人手的水平,但伊隆·马斯克等科技大佬携手创立的非营利组织 OpenAI,正在努力向这个目标抵近。最近,OpenAI 研究人员正在借助人工智能,来教导机器人像人类一样灵巧地操纵物体。通常情况下,科学家们需要通过强化学习来实现这一目标,即让 AI 反复试验学习过程,但这么做相当耗费时间。
如果只是让 AI 去学习怎么玩视频游戏,只需要让它以更快的速度玩游戏就行了。但涉及真实任务时,就有些抓瞎了。
你不能等待机械手臂经过多年的练习,且它难以模拟世界上足够准确的训练课目。
有鉴于此,OpenAI 自行设定了一个任务,教机器人手来操纵一个六面立方体 —— 将它从一个位置移动到另一个位置,期间保持特定的一面朝上。
与早期研究一样,他们首先尽可能地准确模拟这种环境,但下一步,他们会制造差异来搞乱模拟。
首先,研究人员添加了随机的‘视觉噪音’,改变虚拟机械手和立方体的颜色。
然后,随机化立方体的大小、表面滑腻程度、重量、甚至模拟了不同的引力参数。
所有这一切,都是为了让 AI 更好地理解在现实世界中操纵立方体的可能性。
虽然模拟无法将真实情况完全考虑进去,但有了足够的变化,就允许它系统地学习针对意外事件的处理方法。参与 OpenAI 项目的 Matthias Plappert 解释到:
改变模拟的引力,是一件相当有趣的事情。当 AI 系统(Dactyl)在控制真实的机器人手时,手的基部可能每次都处于不同的位置和角度。
如果较低偏低,意味着立方体更容易从手中掉落。为了教 Dactyl 处理这种变化,研究人员决定将模拟中的重力参数也随机化。
如果不这样,它就会因为不习惯而一直掉落物体。事实上,Dactyl 必须积累大约 100 年的经验,才能达到最佳的表现。
反之,研究团队必须耗费大量的计算能力 —— 大约 6144 个 CPU 和 8 组强大的 Nvidia V100 GPU 。
显然,需求如此高的硬件,只有极少数的研究机构才能用上。不过 Plappert 表示,最终的结果,依然是相当值得的:
完成训练后,Dactyl 能够将立方体从一个位置移动到另一个位置,连续执行 50 次动作而不会出现掉落 —— 即便中位数的次数要小得多(只有 13 次)。
在学习移动立方体的过程中,Dactyl 甚至开发出了类似真人的行为,而所有这些都是在没有人为知道的情况下习得的(只是几十年如一日般的反复试验)。
Plappert 表示,这表明 OpenAI 的已经为仿真操控做到了极佳的优化。当你看到一台机器人试图解决问题,本身就是一件很有趣的事情。
[编译自:TheVerge]
稿源:cnBeta.COM
领取专属 10元无门槛券
私享最新 技术干货