Hey
很多人工智能技术通过明确的反馈机制来实现“学习”的概念。就像小学生的算术题,答对一道加一分,打错一道扣一分,在加加减减的过程中,计算机也清楚地了解了自己的优势劣势所在。
然而并不是所有问题都有一个标准答案供它参考。当面对没有明确“对与错”的指示时,人工智能该如何解决动态环境下的规划问题呢?
本期介绍的新技术,不仅解决了“稀疏反馈”的难题,还巨幅压缩了储存空间,无疑将推动该领域在未来的跳跃式发展。
主菜登场
最后,欢迎朋友们阅读该论文。在阅读的过程中,任何的闪光点也可能成为未来的 AI 领域的一片希望,敢想就成功一半了!
论文链接:
https://arxiv.org/abs/1811.04551
github:
https://github.com/google-research/planet
交互网页:
https://planetrl.github.io/
领取专属 10元无门槛券
私享最新 技术干货