深度学习与强化学习

文章来源：企鹅号 - 腾讯云技术社区

更多腾讯海量技术文章，请关注云加社区：https://cloud.tencent.com/developer/column

作者：张戎

深度学习与强化学习

随着 DeepMind 公司的崛起，深度学习和强化学习已经成为了人工智能领域的热门研究方向。除了众所周知的 AlphaGo 之外，DeepMind 之前已经使用深度学习与强化学习的算法构造了能够自动玩 Atari 游戏的 AI，并且在即时战略游戏 StarCraft II 的游戏 AI 构建上做出了自己的贡献。虽然目前还没有成功地使用 AI 来战胜 StarCraft II 的顶尖职业玩家，但是 AI 却能够带给大家无穷的想象力和期待。

本篇 PPT 将会从强化学习的一些简单概念开始，逐步介绍值函数与动作值函数，以及 Q－Learning 算法。然后介绍深度学习中卷积神经网络的大致结构框架。最后将会介绍卷积神经网络是如何和强化学习有效地结合在一起，来实现一些简单的游戏 AI。

之前也写过一份PPT《当强化学习遇见泛函分析》，两份 PPT 有一些重复的地方，读者选择一些看即可。之前文章从强化学习的定义出发，一步一步地给读者介绍强化学习的简单概念和基本性质，并且会介绍经典的 Q-Learning 算法。文章的最后一节会介绍泛函分析的一些基本概念，并且使用泛函分析的经典定理 Banach Fixed Point Theorem 来证明强化学习中 Value Iteration 等算法的收敛性。

发表于: 2018-02-072018-02-07 16:39:20
原文链接：http://kuaibao.qq.com/s/20180207A0QXV100?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

深度学习与强化学习

相关快讯

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐