Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >利用深度强化学习训练柔性机器人

利用深度强化学习训练柔性机器人

原创
作者头像
Jarvis Cocker
发布于 2019-07-17 07:51:46
发布于 2019-07-17 07:51:46
6270
举报

原文标题:On Training Flexible Robots using Deep Reinforcement Learning

摘要:在过去的几十年中,机器人在受控环境中的应用蓬勃发展,训练机器人使用其硬件动态模型开发的控制策略来执行任务已经证明是非常有效的。然而,在许多现实世界中,环境的不确定性、机器人的安全要求和普遍的能力使得刚性工业机器人不适合。这引起了开发柔性机器人硬件控制策略的研究兴趣,而建立柔性机器人硬件的动力学模型具有很大的挑战性。本文在其他领域深入强化学习(DRL)成功的启发下,系统地研究了DRL策略搜索方法在柔性机器人训练中的有效性。结果表明,DRL能够在不同程度的灵活性下成功地学习复杂任务的高效、健壮的策略。我们还注意到,使用深度确定性策略梯度的DRL可能对传感器的选择很敏感,添加更多的信息传感器并不一定会使任务更容易学习。

地址:https://arxiv.org/abs/1907.00269

作者:Zach Dwiel, Madhavun Candadai, Mariano Phielipp

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
人工智能科学论文摘要20篇(2019-07-17)
原文标题:An Overview of the Ludii General Game System
Jarvis Cocker
2019/07/17
2K0
【深度学习】强化学习(五)深度强化学习
  强化学习的基本任务是通过智能体与环境的交互学习一个策略,使得智能体能够在不同的状态下做出最优的动作,以最大化累积奖励。这种学习过程涉及到智能体根据当前状态选择动作,环境根据智能体的动作转移状态,并提供即时奖励的循环过程。
Qomolangma
2024/07/30
7850
【深度学习】强化学习(五)深度强化学习
机器人相关学术速递[12.21]
【1】 Learning Spatio-Temporal Specifications for Dynamical Systems 标题:学习动态系统的时空规范 链接:https://arxiv.org/abs/2112.10714
公众号-arXiv每日学术速递
2021/12/24
4160
机器学习——强化学习与深度强化学习
近年来,强化学习(Reinforcement Learning, RL)在多个领域取得了巨大的进展。从早期简单的迷宫导航问题到今天 AlphaGo 击败围棋世界冠军,强化学习的潜力得到了充分展现。而随着深度学习的引入,深度强化学习(Deep Reinforcement Learning, DRL)更是将这一技术推向了前所未有的高度。本篇文章将深入探讨强化学习与深度强化学习的基本原理、常见算法以及应用场景,旨在为读者提供一个详尽的学习路线图。
hope kc
2024/10/09
2.6K0
【DRL】强化学习中的概念和术语
深度强化学习(Deep Reinforcement Learning, DRL)是强化学习(RL)与深度学习(DL)的交叉领域,其核心在于利用深度学习的表征能力处理 RL 中的高维状态空间、复杂决策问题。传统 RL 在面对图像、语音等非结构化数据时难以有效提取特征,而 DRL 通过神经网络(如 CNN、RNN、Transformer)自动学习状态表示,实现了从感知到决策的端到端优化。
小锋学长生活大爆炸
2025/06/16
2570
基于神经网络的机器人学习与控制:回顾与展望
机器人因其高效的感知、决策和执行能力,在人工智能、信息技术和智能制造等领域中具有巨大的应用价值。目前,机器人学习与控制已成为机器人研究领域的重要前沿技术之一。各种基于神经网络的智能算法被设计,从而为机器人系统提供同步学习与控制的规划框架。首先从神经动力学(ND)算法、前馈神经网络(FNNs)、递归神经网络(RNNs)和强化学习(RL)四个方面介绍了基于神经网络的机器人学习与控制的研究现状,回顾了近30年来面向机器人学习与控制的智能算法和相关应用技术。最后展望了该领域存在的问题和发展趋势,以期促进机器人学习与控制理论的推广及应用场景的拓展。
一点人工一点智能
2023/04/27
2.4K0
基于神经网络的机器人学习与控制:回顾与展望
柔性机械臂:控制算法介绍
建立的系统动力学模型必须按照控制的要求进行简化以便为控制系统的设计提供设计模型。大致可以划分为被动控制和主动控制两大类。
ZC_Robot机器人技术
2020/09/28
6.6K4
柔性机械臂:控制算法介绍
自动控制与人工智能相结合及其典型案例
自动控制技术与人工智能(AI)技术的结合,本质上是“确定性执行”与“智能决策”的深度融合。自动控制技术为系统提供稳定性、实时性和精确性,而人工智能技术赋予系统感知、学习和自适应能力,两者互补推动系统向“更智能、更自主、更高效”演进。以下从结合维度、典型案例及关键技术展开分析:
zzh-dahai
2025/07/17
1820
机器人学科中的运动控制相关技术及案例
在人工智能机器人学中,运动控制技术是核心分支之一,旨在通过算法与硬件的协同,实现机器人对自身运动的精确规划、执行与自适应调整。其本质是“感知-决策-执行”的闭环优化,结合人工智能的感知、学习与决策能力,突破传统运动控制的局限性,赋予机器人更强的环境适应性与任务泛化性。以下从技术维度、典型案例及关键挑战展开分析:
zzh-dahai
2025/07/17
1940
机器人相关学术速递[9.7]
【1】 Gaussian Process Uniform Error Bounds with Unknown Hyperparameters for Safety-Critical Applications 标题:安全关键应用中具有未知超参数的高斯过程一致误差界 链接:https://arxiv.org/abs/2109.02606
公众号-arXiv每日学术速递
2021/09/16
5990
IEEE预发:DeepMind主攻的深度强化学习3大核心算法及7大挑战
【新智元导读】深度强化学习将有助于革新AI领域,它是朝向构建对视觉世界拥有更高级理解的自主系统迈出的一步。本文将涵盖深度强化学习的核心算法,包括深度Q网络、置信区域策略优化和异步优势actor-critic算法(A3C)。同时,重点介绍深度强化学习领域的几个研究方向。 本文预计在IEEE信号处理杂志“图像理解深度学习”专刊发表。作者Kai Arulkumaran是伦敦帝国理工大学的博士生,Marc Peter Deisenroth是伦敦帝国理工大学的讲师,Miles Brundage是亚利桑那州立大学博士
新智元
2018/03/22
1.3K0
IEEE预发:DeepMind主攻的深度强化学习3大核心算法及7大挑战
机器人相关学术速递[7.6]
【1】 Biomimetic Tactile Receptors for 3d-printed Skin 标题:3D打印皮肤的仿生触觉感受器
公众号-arXiv每日学术速递
2021/07/27
8160
通过自动强化学习(AutoRL)进行远程机器人导航 | 强化学习系列
仅在美国就有300万人因行动不便而无法离开家门。可以自动长距离导航的服务机器人可以提高行动不便人员的独立性,例如,通过为他们提供杂货,药品和包裹。研究表明,深度强化学习(RL)擅长将原始感官输入映射到动作,例如学习掌握物体和机器人运动,但RL 代理通常缺乏对长距离导航所需的大型物理空间的理解,并且很难适应新的空间。 在最近的三篇论文中,“ 使用AutoRL学习导航行为端到端 ”,“ PRM-RL:通过结合强化学习和基于采样的规划来实现远程机器人导航任务 ”,以及“ 使用PRM进行远程室内导航” RL “,我们通过将深度RL与远程规划相结合来研究易于适应的机器人自治。我们培训当地规划人员执行基本的导航行为,安全地穿越短距离而不会与移动的障碍物发生碰撞。当地规划人员采用嘈杂的传感器观测,例如一维激光雷达提供到障碍物的距离,并输出机器人控制的线性和角速度。我们使用AutoRL训练本地计划员进行模拟,AutoRL是一种自动搜索RL奖励和神经网络架构的方法。尽管它们的范围有限,只有10到15米,但是当地的规划者可以很好地转移到真正的机器人和新的,以前看不见的环境。这使我们能够将它们用作大空间导航的构建块。然后,我们构建路线图,其中节点是位置的图形,只有当本地规划人员能够可靠地模拟真实机器人及其噪声传感器和控制时,边缘才能连接节点。 自动化强化学习(AutoRL)
用户7623498
2020/08/04
1.3K0
机器人相关学术速递[9.8]
【1】 Optimal Stroke Learning with Policy Gradient Approach for Robotic Table Tennis 标题:基于策略梯度法的机器人乒乓球最优击球学习 链接:https://arxiv.org/abs/2109.03100
公众号-arXiv每日学术速递
2021/09/16
4030
干货 | 这里有一篇深度强化学习劝退文
AI 科技评论按:本文作者 Frankenstein,首发于作者的知乎主页,AI科技评论获取授权转载。 今天在学校又双叒叕提到了 Deep Reinforcement Learning That Matters 这篇打响 DRL(Deep Reinforcement Learning, 深度强化学习)劝退第一枪的文章后,回来以后久违刷了一下推特,看到了这篇爆文 Deep Reinforcement Learning Doesn't Work Yet(https://www.alexirpan.com/201
AI科技评论
2018/03/06
2K0
83篇文献-万字总结 || 强化学习之路
深度强化学习是深度学习与强化学习相结合的产物,它集成了深度学习在视觉等感知问题上强大的理解能力,以及强化学习的决策能力,实现了端到端学习。深度强化学习的出现使得强化学习技术真正走向实用,得以解决现实场景中的复杂问题。从2013年DQN(深度Q网络,deep Q network)出现到目前为止,深度强化学习领域出现了大量的算法,以及解决实际应用问题的论文,本文将阐述深度强化学习的发展现状,并对未来进行展望。
深度强化学习实验室
2020/02/25
1.5K0
83篇文献-万字总结  ||  强化学习之路
机器人相关学术速递[7.22]
【1】 Demonstration-Guided Reinforcement Learning with Learned Skills 标题:带学习技能的示范引导式强化学习
公众号-arXiv每日学术速递
2021/07/27
3570
机器人相关学术速递[9.13]
【1】 Binarized P-Network: Deep Reinforcement Learning of Robot Control from Raw Images on FPGA 标题:二值化P-网络:基于FPGA的机器人原始图像控制的深度强化学习 链接:https://arxiv.org/abs/2109.04966
公众号-arXiv每日学术速递
2021/09/16
7010
机器人相关学术速递[11.9]
【1】 A simple and versatile topology optimization formulation for flexure synthesis 标题:一种简单易行的柔性综合拓扑优化公式 链接:https://arxiv.org/abs/2111.04620
公众号-arXiv每日学术速递
2021/11/17
7550
收藏 | 83篇文献,万字总结强化学习之路
深度强化学习是深度学习与强化学习相结合的产物,它集成了深度学习在视觉等感知问题上强大的理解能力,以及强化学习的决策能力,实现了端到端学习。深度强化学习的出现使得强化学习技术真正走向实用,得以解决现实场景中的复杂问题。从2013年DQN(深度Q网络,deep Q network)出现到目前为止,深度强化学习领域出现了大量的算法,以及解决实际应用问题的论文,本文将阐述深度强化学习的发展现状,并对未来进行展望。
AI科技大本营
2020/03/02
6820
收藏 | 83篇文献,万字总结强化学习之路
相关推荐
人工智能科学论文摘要20篇(2019-07-17)
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档