Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >20分钟学会装配电路板!开源SERL框架精密操控成功率100%,速度三倍于人类

20分钟学会装配电路板!开源SERL框架精密操控成功率100%,速度三倍于人类

作者头像
机器之心
发布于 2024-02-26 10:10:14
发布于 2024-02-26 10:10:14
1920
举报
文章被收录于专栏:机器之心机器之心

机器之心专栏

机器之心编辑部

现在,机器人学会工厂精密操控任务了。

近年来,机器人强化学习技术领域取得显著的进展,例如四足行走,抓取,灵巧操控等,但大多数局限于实验室展示阶段。将机器人强化学习技术广泛应用到实际生产环境仍面临众多挑战,这在一定程度上限制了其在真实场景的应用范围。强化学习技术在实际应用的过程中,任需克服包括奖励机制设定、环境重置、样本效率提升及动作安全性保障等多重复杂的问题。业内专家强调,解决强化学习技术实际落地的诸多难题,与算法本身的持续创新同等重要。

面对这一挑战,来自加州大学伯克利、斯坦福大学、华盛顿大学以及谷歌的学者们共同开发了名为高效机器人强化学习套件(SERL)的开源软件框架,致力于推动强化学习技术在实际机器人应用中的广泛使用。

  • 项目主页:https://serl-robot.github.io/
  • 开源代码:https://github.com/rail-berkeley/serl
  • 论文题目:SERL: A Software Suite for Sample-Efficient Robotic Reinforcement Learning

SERL 框架主要包含以下几个组件:

1、高效强化学习

在强化学习领域,智能体(如机器人)通过与环境的互动来掌握执行任务的方法。它通过尝试各种行为并根据行为结果获得奖励信号,从而学习出一套旨在最大化累积奖励的策略。SERL 采用 RLPD 算法,赋能机器人同时从实时互动和之前收集的离线数据中学习,大大缩短机器人掌握新技能需要的训练时间。

2、多样的奖励规定方法

SERL 提供了多种奖励规定方法,允许开发人员根据特定任务的需求定制奖励结构。例如,固定位置的安装任务可以按照机械手的位置制定奖励,更复杂的任务可以使用分类器或 VICE 学习一个准确的奖励机制。这种灵活性有助于精确指导机器人学习特定任务的最有效策略。

3、无重制功能

传统的机器人学习算法都需要定期重置环境,进行下一轮交互学习。在很多任务中这无法自动实现。SERL 提供的无重制强化学习功能同时训练前向 - 后向两个策略,为彼此提供环境重置。

4、机器人控制接口

SERL 提供了一系列 Franka 机械手任务的 Gym 环境接口作为标准示例,方便用户可以轻松地将 SERL 拓展到不同的机械臂上。

5、阻抗控制器

为了确保机器人可以在复杂的物理环境中安全精确地探索与操作,SERL 为 Franka 机械臂提供了特殊的阻抗控制器,在保证准确性的同时确保与外界物体接触后不产生过大的力矩。

通过这些技术和方法的结合,SERL 大大缩短了训练时间,同时保持了高成功率和鲁棒性,使机器人能够在短时间内学习完成复杂任务,并在现实世界中有效应用。

图 1、2: SERL 和行为克隆方法在各项任务中成功率和节拍数对比。在相似数据量的情况下,SERL 的成功率要比克隆的高出数倍 (最高 10 倍),节拍数也要快上至少两倍。

应用案例

1、PCB 元件组装:

在 PCB 板上装配穿孔元件是一项常见却又充满挑战的机器人任务。电子元件的引脚极易弯曲,而孔位与引脚之间的公差非常小,要求机器人在装配时既要精准又要轻柔。通过仅仅 21 分钟的自主学习,SERL 使机器人达到了 100% 的任务完成率。即便面临如电路板位置移动或视线部分被遮挡等未知的干扰,机器人也能稳定完成装配工作。

图 3、4、5:在执行电路板元件安装任务时,机器人能够应对在训练阶段未曾遇到的各种干扰,顺利完成任务。

2、电缆布线:

在许多机械和电子设备的组装过程中,我们需要将电缆沿着特定的路径精确地安装到位,这一任务对精度和适应性提出了很高的要求。由于柔性电缆在布线过程中容易产生形变,而且布线过程可能会受到各种干扰,比如电缆被意外移动或者夹持器位置的变化,这导致使用传统的非学习型方法难以应对。SERL 能够在短短 30 分钟内实现 100% 的成功率。即便是在夹持器位置与训练期间不同时,机器人也能够泛化其学习到的技能,适应新的布线挑战,确保布线工作的正确执行。

图 6、7、8:机器人无需更多的专项训练也能直接把线缆穿过与训练时位置不一样的夹子里。

3、物体抓取摆放操作:

在仓库管理或零售业中,机器人经常需要将物品从一个地方移动到另一个地方,这要求机器人能够识别并搬运特定的物品。强化学习的训练过程中,很难对欠驱动的物体进行自动的归位重置。利用 SERL 的无重置强化学习功能,机器人在 1 小时 45 分钟内同时学习两个 100/100 成功率的策略。用前向策略把物体从 A 箱放到 B 箱,再用后向策略把物体从 B 箱归为回 A 箱。

图 9、10、11:SERL 训练了两套策略,一个把物体从右边搬运到左边,一个从左边放回右边。机器人不仅在训练物体上达到 100% 成功率,就连没见过的物体也能智能搬运。

主要作者

1. Jianlan Luo

Jianlan Luo 目前是加州大学伯克利分校电子与计算机科学系的一名博士后学者,他在伯克利人工智能中心 (BAIR) 与 Sergey Levine 教授合作。他的主要研究兴趣在于机器学习,机器人学,以及最优控制。在回到学术界前,他是 Google X 的一名全职研究员,与 Stefan Schaal 教授合作。在此之前,他在加州大学伯克利分校取得计算机科学硕士学位,机械工程博士学位;此间他与 Alice Agogino 教授,Pieter Abbeel 教授一起工作。他也曾在 Deepmind 伦敦总部担任访问研究学者。

2. Zheyuan Hu

他本科毕业于加州大学伯克利的计算机科学和应用数学专业。目前,他在由 Sergey Levine 教授领导的 RAIL 实验室进行研究。他对机器人学习领域有浓厚的兴趣,专注于开发能够使机器人在真实世界中迅速且广泛地掌握灵巧操作技能的方法。

3. Charles Xu

他是加州大学伯克利分校的一名电气工程与计算机科学专业的四年级本科生。目前,他在由 Sergey Levine 教授领导的 RAIL 实验室进行研究。他的研究兴趣位于机器人技术与机器学习的交汇处,旨在构建高鲁棒性且具有泛化能力的自主操控系统。

4. You Liang Tan

他是伯克利 RAIL 实验室的研究员工程师,由 Sergey Levine 教授指导。他先前在新加坡南洋理工大学获得了学士学位和美国佐治亚理工学院完成了硕士学位。在此之前,他曾是开源机器人基金会(Open Robotics)的一员。他的工作专注于机器学习和机器人软件技术在真实世界应用。

5. Stefan Schaal

他于 1991 年在德国慕尼黑的慕尼黑技术大学获得机械工程和人工智能方面的博士学位。他是麻省理工学院大脑与认知科学部及人工智能实验室的博士后研究员,日本 ATR 人类信息处理研究实验室的特邀研究员,以及美国佐治亚理工学院和宾夕法尼亚州立大学运动学系的兼职助理教授。在日本 ERATO 项目期间,他还担任计算学习小组组长,该项目为川人动态大脑项目(ERATO/JST)。1997 年,他成为南加州大学计算机科学、神经科学和生物医学工程教授,并晋升为终身教授。他的研究兴趣包括统计与机器学习、神经网络与人工智能、计算神经科学、功能性脑成像、非线性动力学、非线性控制理论、机器人学及仿生机器人等主题。

他是德国马克斯・普朗克智能系统研究所的创始董事之一,在那里他多年领导了自主运动部门。他目前是 Alphabet [Google] 的新机器人子公司 Intrinsic 的首席科学家。Stefan Schaal 是 IEEE Fellow。

6. Chelsea Finn

她是斯坦福大学计算机科学与电气工程的助理教授。她的实验室 IRIS 研究通过大规模机器人互动来探索智能,该实验室隶属于 SAIL 和 ML Group。她也是 Google Brain 团队的一员。她对机器人和其他智能体通过学习和互动发展出广泛智能行为的能力感兴趣。此前,她在加州大学伯克利分校完成了计算机科学博士学位,以及在麻省理工学院获得了电气工程与计算机科学学士学位。

7. Abhishek Gupta

他是华盛顿大学保罗・G・艾伦计算机科学与工程学院的助理教授,领导 WEIRD 实验室。此前,他在麻省理工学院作为博士后学者,与 Russ Tedrake 和 Pulkit Agarwal 合作。他在加州大学伯克利分校的 BAIR 完成了关于机器学习与机器人学的博士学位,期间受到 Sergey Levine 教授和 Pieter Abbeel 教授的指导。在此之前,他也在加州大学伯克利分校完成了他的学士学位。他的主要研究目标是开发算法,使机器人系统能够学会在各种非结构化环境中执行复杂任务,如办公室和家庭。

8. Sergey Levine

他是加州大学伯克利分校电气工程与计算机科学系的副教授。他的研究专注于能够使自主智能体通过学习获得复杂行为的算法,特别是那些能够使任何自主系统学会解决任何任务的通用方法。这些方法的应用包括机器人技术,以及需要自主决策的其他一系列领域。

© THE END

转载请联系本公众号获得授权

投稿或寻求报道:content@jiqizhixin.com

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-02-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器之心 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
机器人会三思而后行
该文章介绍了一种名为Vestri的机器人,它具有视觉预见能力,可以在没有提前编程的情况下,自主学习如何移动物体。这项技术基于“卷积递归视频预测”,可以预测图像中的像素如何根据机器人的行为从一帧移动到另一帧。这项技术使得机器人可以在复杂的现实环境中实现高度灵活的智能规划,从而帮助无人驾驶汽车等实现更广泛的应用。
企鹅号小编
2018/01/05
6500
机器人会三思而后行
UC伯克利最新深度学习课程上线,强化学习大牛Sergey Levine授课(B站可看)
近日,深度学习课程 CS182 已发布所有视频课程(截至目前),课程讲师是来自加州大学伯克利分校电气工程与计算机科学系的助理教授 Sergey Levine 。
机器之心
2021/03/30
6850
UC伯克利最新深度学习课程上线,强化学习大牛Sergey Levine授课(B站可看)
人工智能发展超想象机器人现在已具备预判能力
本文介绍了加州大学伯克利分校的研究团队开发了一种新的机器人学习技术,使机器人能够提前思考,以“弄清楚如何操作他们从未遇到过的物体”。这项技术被称为“视觉预见”,可以让机器人预测未来几秒钟内的摄像头将会看到什么。通过这项技术,伯克利分校的研究人员使得机器人能够在没有人的输入、监督或之前的物理知识的情况下完成小任务。视觉预见是基于“卷积反复的视频预测”,即动态神经平流(DNA)。
企鹅号小编
2018/01/09
9650
人工智能发展超想象机器人现在已具备预判能力
25分钟训练机器人学会6个动作,伯克利开发高效机器人操纵框架
这就是来自加州大学伯克利分校的一项新研究——高效机器操作框架Framework for Efficient Robotic Manipulation(FERM),专门对机械臂进行高效率操作的算法训练。
AI 电堂
2021/01/08
6590
这位伯克利小姐姐,让机器人能“预见未来”
几日前,美国加州大学伯克利分校(简称UC Berkeley)AI实验室推出了一款名叫Vestri的机器人。虽然它没有波士顿动力Atlas那样能后空翻的本事,也没有俄罗斯机器人Fedor射击、开车的酷炫本领,但却凭借“预见未来”的超凡能力赢得了大家的关注。 所谓的“预见未来”并不像极具玄幻色彩的水晶球、塔罗牌那样,Vestri只是一个好学的“孩子”,它通过用各种能想到的方式“把玩”面前的物品,并通过摄像头采集视频信息,Vestri会记下每次移动物体时的路线。当Vestri面对了一个新的物品,不用再动手玩耍,V
企鹅号小编
2018/03/05
7990
这位伯克利小姐姐,让机器人能“预见未来”
可做出是否伤人决定的机器人,像我们人类一样,机器人也具备“预见”能力
可做出是否伤人决定的机器人 据科技网站Futurism.com北京时间1月2日报道,美国加州大学伯克利分校的一个研究小组发现,像我们人类一样,机器人也具备“预见”能力,借助于视频识别技术,机器人在移动物体之前预测到可能发生的情况。 众所周知,人类在采取行动之前一般先进行思考。例如,如果一个人想去踢球,他或她首先可能会考虑球会滚到哪里,以及怎样踢球才能令其滚到新位置。通常情况下,机器人不具备这种能力,因为它们内部的程序通常只能执行简单的任务,尤其是那些没有配备人工智能程序的机器人。 但是,加州大学伯克利分
企鹅号小编
2018/01/10
5520
可做出是否伤人决定的机器人,像我们人类一样,机器人也具备“预见”能力
王鹤团队获ICLR 2022机器人ManiSkill挑战赛无额外标注赛道冠军
获奖证书 日前,由美国加州大学圣地亚哥分校、伯克利分校以及斯坦福大学联合在国际机器学习顶级会议 ICLR 2022上举办的机器人挑战赛 SAPIEN ManiSkill Challenge 2021落下帷幕。北京大学前沿计算研究中心王鹤老师领导的参赛队伍 EPIC Lab 在无额外标注(No External Annotation Track)赛道获得冠军。 论文链接:https://arxiv.org/abs/2203.02107 1 比赛详情 ManiSkill Challenge 致力于让机器人学习到
AI科技评论
2022/05/05
7250
王鹤团队获ICLR 2022机器人ManiSkill挑战赛无额外标注赛道冠军
摘掉“人工智障”帽子:新技术让机器人也能“三思后行”
1月2日早间消息,加州大学伯克利分校的最新研究成果显示,机器人也可以具备“预见”功能,通过视频识别技术在移动物体之前预测到可能发生的情况。 视频介绍:点此观看 人类有能力在采取行动之前首先进行思考。例如,如果有人想踢球,可能就会考虑球会跑到那里去,以及把球踢到新位置的概率。机器人往往不具备这种能力,因为它们内部的程序通常只能执行简单的任务,没有配备人工智能程序的机器人尤其如此。 但加州大学伯克利分校的研究人员却发现,机器人也可以具备这种直觉。为了证明这一点,他们开发了新的机器人学习技术,使得机器人可以提
企鹅号小编
2018/01/09
5670
摘掉“人工智障”帽子:新技术让机器人也能“三思后行”
2018 ACM博士论文奖公布:伯克利博士获奖,清华姚班马腾宇荣誉提名
今日,ACM 公布最佳博士论文奖,来自 UC 伯克利的博士生 Chelsea Finn 凭借论文《Learning to Learn with Gradients》摘得桂冠。这篇论文介绍了一种基于梯度的新型元学习算法,帮助深度网络基于小型数据集解决新任务,该算法可用于计算机视觉、强化学习和机器人学等领域。
机器之心
2019/05/17
5880
​免费报名丨RLChina 2021 强化学习暑期课,20位RL专家为你保驾护航!
免费报名丨RLChina 2021 强化学习暑期课,20位RL专家为你保驾护航! 导读 RLChina 暑期课是由 UCL 汪军老师发起,所有参与教师共同分享给广大强化学习爱好者的免费网络直播课程。2020 年的课程吸引了超过 3 千名报名学员,获得了广泛的好评。今年,RLChina 暑期课全新升级,20 位来自全球顶级高校和企业的强化学习专家共同为大家讲解从入门到前沿的强化学习知识,此外还准备了习题课、智能体竞赛日、决策智能创业日帮助大家全方位地接触强化学习落地实践。 课程安排 时 间 2021 年 8
博文视点Broadview
2023/05/06
2050
​免费报名丨RLChina 2021 强化学习暑期课,20位RL专家为你保驾护航!
上交大校友获最佳论文,机器人顶会CoRL 2022奖项公布
机器之心报道 机器之心编辑部 在刚刚落幕的CoRL 2022大会中,本科曾就读于上海交通大学的Kun Huang获得了最佳论文奖。 自 2017 年首次举办以来,CoRL 已经成为了机器人学与机器学习交叉领域的全球顶级学术会议之一。CoRL 是面向机器人学习研究的 single-track 会议,涵盖机器人学、机器学习和控制等多个主题,包括理论与应用。 2022年的CoRL大会于12月14日至18日在新西兰奥克兰举行。 本届大会共收到504篇投稿,最终接收34篇Oral论文、163篇Poster论文,接收
机器之心
2023/03/29
4550
上交大校友获最佳论文,机器人顶会CoRL 2022奖项公布
【越好奇,越强大】伯克利研究人员使用内在激励,教AI学会好奇
来源:Quanta Magazine 编译:Cecilia 【新智元导读】伯克利研究人员正在开发具有好奇心的AI。他们想创造有内在自我驱动能力的AI,而不是依赖人类指令的伪智能。相比外在的奖惩机制,建立方法让智能体拥有内在的好奇心更加重要。研究人员将让AI感到“吃惊”的指数,即对环境预测的误差,作为内在激励函数。吃惊越大,奖励越多,以此让AI迅速掌握环境。 你可能不记得第一次玩“超级马里奥兄弟”是什么感觉,但试着想像一下:蓝色的天空,棋盘石的地面,还有一个蹲着的红色男人在静静等待。他面向右方,你把他推到那个
新智元
2018/03/21
9050
【越好奇,越强大】伯克利研究人员使用内在激励,教AI学会好奇
华人学者再创佳绩!包揽CoRL2021最佳论文奖项
备受关注的论文大奖全部被华人学者包揽。来自麻省理工大学的Tao Chen, Jie Xu, Pulkit Agrawal(导师)拿下最佳论文奖;来自哥伦比亚大学的Huy Ha, 宋舒然(导师)拿下最佳系统论文奖。
AI科技评论
2021/11/17
4580
1899篇论文、1329个机构、6012位作者,NeurIPS 2020谁在独领风骚?
机器之心发布 机器之心编辑部 机器之心《2020-2021 全球 AI 技术趋势发展报告》节选:顶会趋势(NeurIPS)分析。 2021 年 1 月,机器之心发布《2020-2021 全球 AI 技术趋势发展报告》,基于顶会、论文及专利等公共数据、机器之心专业领域数据仓库,通过数据挖掘定位七大趋势性 AI 技术领域。 此外,该报告还邀请了近 100 位专家学者通过问卷调查,形成对这七大技术领域近年发展情况、成熟度与未来趋势的综合总结,并基于 2015-2020 年间的开源论文与专利语料,结合机器之心自有
机器之心
2021/03/15
3280
1899篇论文、1329个机构、6012位作者,NeurIPS 2020谁在独领风骚?
UC伯克利出品,深度强化学习最新课程已上线
当地时间 10 月 11 日,UC 伯克利电气工程与计算机科学系(EECS)助理教授 Sergey Levine 在推特上宣布,他讲授的 CS285 深度强化学习(RL)课程已经放出了部分视频,并表示之后每周会实时更新后续课程。
机器之心
2020/10/27
4480
UC伯克利出品,深度强化学习最新课程已上线
深度强化学习大牛、UC伯克利教授Pieter Abbeel获2021 ACM计算奖
机器之心报道 机器之心编辑部 AI 大牛吴恩达的学生、机器人学习专家、UC 伯克利教授 Pieter Abbeel 摘得了最新一届 ACM 计算奖的荣誉。 刚刚,ACM 官方宣布将 2021 ACM 计算奖(ACM Prize in Computing)授予加州大学伯克利分校教授 Pieter Abbeel,以表彰他在机器人学习方面的贡献,包括从演示中学习和用于机器人控制的深度强化学习。 在获奖公告中,ACM 提到:「Abbeel 率先教会机器人从人类演示中学习(学徒学习)和通过自己的反复试错学习(强化
机器之心
2022/04/08
4740
深度强化学习大牛、UC伯克利教授Pieter Abbeel获2021 ACM计算奖
Google搞出的AlphaGo,打开了机器学习的神秘之门
两个机械臂,尝试打开两扇关闭的门。两个机器臂向前伸出,然后全都错过门把手。重来,再试一次,结果撞到把手上,门框铛铛作响。于是再试一次。再一次。几个小时的试验和犯错之后,两个机械臂都能干净利索的把门打开,次次如此。 这两个机械臂都待在Google内部的某处,虽然机械装置很早就能敏捷的拉开门,但这次有所不同:这两个机械臂自己学会了打开门。依靠一种称为“强化学习”的技术,它们训练自己执行一个特定的任务,一遍又一遍的训练,学会怎么做是可行的,怎么是不可行的。 去年相同的技术驱动着AlphaGo学会了古老的围棋,而且
量子位
2018/03/21
6610
Pieter Abbeel NIPS 2017大会报告《Deep Learning for Robots》
Pieter Abbeel 在 NIPS 2017 上分享了关于深度学习在机器人领域的应用。他介绍了多种用于机器人研究的深度学习方法,包括强化学习、元学习、模仿学习、持续学习,以及这些方法的重要参考文献及细分领域研究进展。
企鹅号小编
2018/01/08
1.1K0
Pieter Abbeel NIPS 2017大会报告《Deep Learning for Robots》
吴恩达的开门大弟子 Pieter Abbeel 获 2021 年 ACM 计算奖:其是学徒学习和强化学习领域的开拓者
今年的计算机协会(ACM)计算奖将颁发给一位机器学习专家,即使你没有听说过他的大名,但也很可能熟悉他的工作。 Pieter Abbeel是加州大学伯克利分校的教授,还是AI机器人公司Covariant的联合创始人。他摘得了该奖项,同时获得250000美元的奖金,该奖项授予机器学习领域“研究贡献具有根本性影响和广泛影响”的杰出人士。 Abbeel是一位计算机科学和电气工程教授,他的工作已在圈内得到了相当高的认可。 Abbeel是吴恩达的第一位博士生,吴恩达当时是斯坦福大学的一年级教授。 2017年吴恩达采
云头条
2022/04/08
5230
吴恩达的开门大弟子 Pieter Abbeel 获 2021 年 ACM 计算奖:其是学徒学习和强化学习领域的开拓者
第一届机器人学习大会总结
文 / Google Brain 团队首席科学家 Vincent Vanhoucke 和院校关系项目经理 Melanie Saldaña 无论是自动驾驶车辆,还是家居助手或灾难救援装置,未来机器人系统都需要能够在以人为中心的环境中安全且高效地操作。与行业竞争者相比,它们需要对周围世界保持极高水平的感性认识,并适应目标和环境方面的持续变化。机器学习可以自然地解决对未知环境的感知和泛化问题,随着计算机视觉和学习能力近期的快速发展,将这些新技术应用到机器人学领域将成为一个核心研究问题。 在刚刚过去的 11 月
企鹅号小编
2018/01/19
5690
第一届机器人学习大会总结
推荐阅读
机器人会三思而后行
6500
UC伯克利最新深度学习课程上线,强化学习大牛Sergey Levine授课(B站可看)
6850
人工智能发展超想象机器人现在已具备预判能力
9650
25分钟训练机器人学会6个动作,伯克利开发高效机器人操纵框架
6590
这位伯克利小姐姐,让机器人能“预见未来”
7990
可做出是否伤人决定的机器人,像我们人类一样,机器人也具备“预见”能力
5520
王鹤团队获ICLR 2022机器人ManiSkill挑战赛无额外标注赛道冠军
7250
摘掉“人工智障”帽子:新技术让机器人也能“三思后行”
5670
2018 ACM博士论文奖公布:伯克利博士获奖,清华姚班马腾宇荣誉提名
5880
​免费报名丨RLChina 2021 强化学习暑期课,20位RL专家为你保驾护航!
2050
上交大校友获最佳论文,机器人顶会CoRL 2022奖项公布
4550
【越好奇,越强大】伯克利研究人员使用内在激励,教AI学会好奇
9050
华人学者再创佳绩!包揽CoRL2021最佳论文奖项
4580
1899篇论文、1329个机构、6012位作者,NeurIPS 2020谁在独领风骚?
3280
UC伯克利出品,深度强化学习最新课程已上线
4480
深度强化学习大牛、UC伯克利教授Pieter Abbeel获2021 ACM计算奖
4740
Google搞出的AlphaGo,打开了机器学习的神秘之门
6610
Pieter Abbeel NIPS 2017大会报告《Deep Learning for Robots》
1.1K0
吴恩达的开门大弟子 Pieter Abbeel 获 2021 年 ACM 计算奖:其是学徒学习和强化学习领域的开拓者
5230
第一届机器人学习大会总结
5690
相关推荐
机器人会三思而后行
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档