OpenAI“最先进”的系统使机器人更加的人性化

文章来源：腾讯云开发者社区Kyle Wiggers

OpenAI是一家位于旧金山的非营利性人工智能研究公司，由Elon Musk，Reid Hoffman和Peter Thiel以及其他行业巨头支持，在6月宣布最新版本的Dota 2播放AI 时成为头条新闻- 被称为OpenAI Five - 成功击败了业余球员。今天，它首次推出了一个机器人系统，可以操纵具有人类灵活性的物体。

在即将发表的一篇论文（“灵巧的手工操作”）中，OpenAI研究人员描述了一种系统，该系统使用强化模型，人工智能通过反复试验来学习，指导机器人手掌握和操纵物体的状态。艺术精准。更令人印象深刻的是，它在计算机模拟中完全以数字方式进行了训练，并没有提供任何人类演示来学习。

“虽然对物体的灵巧操控是人类的一项基本日常任务，但它仍然是自动机器人的挑战，”该团队写道。“现代机器人通常设计用于受限设置中的特定任务，并且在很大程度上无法使用复杂的末端效应器......在这项工作中，我们演示了训练控制策略的方法，这些策略执行手动操作并将其部署在物理机器人上。 ”

那怎么做呢？研究人员使用MuJoCo物理引擎来模拟真实机器人可能在其中运行的物理环境，并使用Unity来渲染图像以训练计算机视觉模型以识别姿势。但该团队写道，这种方法有其局限性 - 模拟仅仅是物理设置的“粗略近似”，这使得“不太可能”生成可以很好地转化为现实世界的系统。

OpenAI机器人系统发现的新对象操作。

图片来源：OpenAI

他们的解决方案是随机化环境的各个方面，如物理（摩擦，重力，关节限制，物体尺寸等）和视觉外观（照明条件，手和物体姿势，材料和纹理）。这既降低了过度拟合的可能性 - 当神经网络在训练数据中学习噪声，对其性能产生负面影响时发生的现象 - 并且增加了生成基于真实世界指尖位置和对象姿势成功选择动作的算法的机会。

接下来，研究人员使用384台机器训练模型 - 一个循环神经网络 - 每台机器有16个CPU核心，每小时可以产生大约两年的模拟经验。在八GPU上进行优化后，他们进入下一步：训练卷积神经网络，从三个模拟摄像机图像中预测机器人“手”中物体的位置和方向。

说明模型训练过程的图表流程。

图片来源：OpenAI

一旦模型被训练，就进行验证测试。研究人员使用了一只暗影灵巧之手，这是一只五指共有24个自由度的机器人手，安装在铝制框架上以操纵物体。同时，两组摄像机 - 运动捕捉摄像机和RGB摄像机 - 作为系统的眼睛，可以跟踪物体的旋转和方向。（尽管暗影灵巧手具有触摸传感器，但该团队仅选择使用其关节感应功能对手指位置进行细粒度控制。）

在两个测试的第一个中，算法的任务是重新定向标有字母表字母的块。团队选择了一个随机目标，每次AI实现它时，他们选择一个新目标，直到机器人（1）掉落块，（2）花了一分多钟操纵块，或（3）成功旋转50次。在第二次测试中，块与八角形棱镜交换。

结果？这些模型不仅表现出“前所未有”的表现，而且还自然发现了在人类中观察到的类型的抓握，例如三脚架（使用拇指，食指和中指的握把），棱柱形（拇指和手指相对的握把）彼此）和尖端捏握。他们还学习了如何旋转和滑动机器人手的手指，以及如何使用重力，平移和扭转力将物体插入所需位置。

他们写道：“你的系统可以重新发现在人类身上发现的掌握，而是让它们更好地适应自己身体的局限和能力。”

这并不是说它是一个完美的系统。它没有经过明确的训练来处理多个物体 - 它很难旋转球形的第三个物体。在第二次测试中，模拟与真实机器人之间存在可测量的性能差距。

但最终，结果证明了当代深度学习算法的潜力，研究人员得出结论：“[这些]算法可以应用于解决复杂的现实世界机器人问题，这些问题超出了现有的非学习方法的范围。 ”

发表于: 2018-07-302018-07-30 09:00:00
原文链接：https://venturebeat.com/2018/07/30/openais-state-of-the-art-system-gives-robots-humanlike-dexterity/
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

OpenAI“最先进”的系统使机器人更加的人性化

相关快讯

扫码

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐