高层速读
关键信息:英伟达西雅图研究团队开发了一套新系统,可以通过观察一个人的行为来教机器人执行新任务,机器人只需观看一次便可成功模拟人类的简单行为,让机器人在充满人类的地方工作,甚至可以向人类学习。
关键意义:训练过程有着非常强烈的视觉效果,而英伟达在图形硬件方面的专业背景肯定会有所帮助。
十年前,一部叫《Heros》的美剧中,英雄可以通过观看和视觉学习,学会飞檐走壁和拳击散打。再复杂的动作 hero只要看一遍,就可以像复印机一样自己复制,丝毫不差地展现出来。
如今,有了视觉识别和深度学习等技术,这一切不再是科幻美剧。英伟达机器人团队开始教机器人学习人类简单行为,且只观看一遍就能成功模拟,而这一切仅距离这部被称为脑洞大开的美剧不到10年而已。
工业机器人通常总是一遍又一遍地重复已经编程好的的任务,通常情况下,机器人与编写程序的工程师之间存在距离。然而,越来越多的研究人员开始思考如何让机器人在充满人类的地方工作,甚至可以向人类学习。
在某种程度上,这正是Nvidia在西雅图的新机器人实验室所关注的,该公司的研究团队今天在澳大利亚的机器人与自动化国际会议(ICRA)上,展示了机器人如何向人类学习的试验,以及其最近关于机器人教学的工作。
正如英伟达的机器人技术研究高级总监Dieter Fox(也是华盛顿大学教授)所言,该团队希望能让下一代机器人安全地在接近人类的地方工作,但要做到这一点,这些机器人需要能够探测到人,追踪他们的活动,并学习人类如何帮助他人,这可能是在小规模的工业环境中或者在某人的家里实现。
英伟达机器人高级总监Dieter Fox
虽然有可能训练一种通过机械重复来玩电子游戏的算法,并能教会它从错误中学习,但Fox认为,这种训练机器人的方式可能会因为机器人要做决策的内容太多而无法有效地完成。相反,由Stan Birchfield和Jonathan Tremblay领导的英伟达研究团队开发了一套新系统,可以通过简单观察一个人的行为来教机器人执行新任务。
实验中的任务非常简单,只需将几个彩色的方块堆起来就可以,但这也是让人类快速教授机器人新任务过程中的重要一步。
研究人员首先训练了一系列神经网络来检测积木,并推断积木之间的关系,然后生成一个程序来重复它所观察到的人类堆积木的过程。研究人员说,这个新系统使机器人观看现实世界中的一次演示,便能完成堆积木任务。
该系统的一个优点是,它生成一个可读的关于它所执行步骤的描述,以便让研究人员更容易地弄清楚错误发生的具体情况。
英伟达公司的Stan Birchfieldt称,该团队的目标是让非专业人员对机器人进行训练变得容易,而且很少有任务比实验中展示的堆积木任务更简单。
在该实验中,正如英伟达团队在ICRA展示的那样,有一台摄影机负责观看现场,人类只是走上前去,拿起积木并堆叠起来,然后让机器人重复这个任务。这听起来很简单,但对于机器人来说,这是一项艰巨的任务。
为了训练核心模型,该团队主要使用来自模拟环境的合成数据,正如Birchfield和Fox强调的那样,正是这些模拟使得机器人能够进行快速训练,毕竟,在现实世界中进行训练的时间要长得多,而且可能会更加危险。对于大多数的任务,都没有现成的带标签的训练数据。
“我们认为,使用模拟技术是一种强大的范例,它将训练机器人完成以前不可能完成的事情,”Birchfield指出,Fox回应了这一观点,并指出这种对模拟的需要是Nvidia认为其硬件和软件最适合这种研究的原因之一。
毕竟,这个训练过程有着非常强烈的视觉效果,而英伟达在图形硬件方面的专业背景肯定会有所帮助。
Fox承认,还有很多研究要做(毕竟,大部分的模拟都不是实际情况),但至少这一理论的核心基础已经到位。
未来,英伟达团队计划扩大机器人可以学习的任务范围,以及描述这些任务所需的词汇量。
分享这篇文章
与同仁共同探讨AI行业动向
往期文章
「AI商业报道」现已入驻
知乎号 | 头条号 | 百家号 | 网易号 | ZAKER
领取专属 10元无门槛券
私享最新 技术干货