人智能领域不断的刷新着惊喜,据海外媒体报道,最近一个叫Rainbow Dash的机器人自己学会了走路。这台四脚的机器,只学习了几个小时,就学会向前、向后行走,并在此过程中,左右转弯。
来自谷歌、加州大学伯克利分校和乔治亚理工学院的研究人员,在ArXiv预印本服务器上发表了一篇论文,描述了一种被称为深度强化学习(deep reinforcementlearning)的统计人工智能技术。
大多数强化学习部署都在计算机模拟的环境中进行。但是,Rainbow Dash使用此技术来学习在实际物理环境中行走。
而且,它能够在没有专门的教学机制的情况下做到这一点,例如人工训练或标记的样本数据。最终,Rainbow Dash成功地在多个表面上行走,包括柔软的泡沫床垫和带有明显凹口的门垫。
机器人使用的深度强化学习技术包括一种机器学习,在这种机器学习中,通过代理与环境交互,来反复试验学习。大多数强化学习用例都涉及到计算机游戏,在这些游戏中,数字代理学习如何获胜。
这种形式的机器学习明显不同于传统的有监督或无监督学习,传统的机器学习模型需要标记训练数据来学习。深度强化学习将强化学习方法与深度学习相结合,使传统机器学习的规模大大扩展,计算能力大大增强。
尽管研究小组认为Rainbow Dash自己学会了走路,但人为干预仍在实现该目标方面发挥了重要作用。研究人员必须创建边界,机器人可以在该范围内学习走路,以防止机器人离开该区域。
他们还必须设计特定的算法来防止机器人坠落,其中一些算法侧重于限制机器人的运动。为了防止诸如坠落损伤等事故的发生,机器人强化学习通常是在数字环境中进行,然后将算法转移到物理机器人上,以保持其安全性。
在研究人员弄清楚如何让机器人在物理环境(而不是虚拟环境)中学习之后,历时一年的时间,Rainbow Dash取得了巨大的成功。研究人员表示,“通过允许机器人自主学习,机器人将能够在更接近于我们现实生活的世界中学习。”
GitHub : https://github.com/BraneShop/showreel/issues/470
注:本文根据多篇最新英文相关资料整理而成,水平和能力有限,不足之处还请多指正。
领取专属 10元无门槛券
私享最新 技术干货