本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。
自从有了强化学习(RL),AI上能星际争霸,下能雅达利称王,让内行人沉醉,让外行人惊奇。
这里恰有一份标星过万的强化学习资源,既有教程推荐,又有配套练习,网友学了都说好,并且还在实时更新。
入学要求并不高,只需要一些基础的数学和机器学习知识。
想要入门强化学习,一份优质的课程必不可少。
强化学习资源千千万,项目作者 Denny Britz 大力推荐这两个:
David Silver 的强化学习课程:
http://www0.cs.ucl.ac.uk/staff/d.silver/web/Teaching.html
以及 Richard Sutton 和 Andrew Barto的《强化学习:简介(第二版)》:
http://incompleteideas.net/book/RLbook2018.pdf
p.s. 实测无需魔法
Denny Britz 小哥表示,这两本书几乎涵盖了入门强化学习需要了解的大部分研究论文,基础决定高度,理论知识还是要扎扎实实学起来。
理论有了,可书里并没有算法实现。
别担心,帮人帮到底,送佛送到西,Denny Britz 亲自动手,用 Python,OpenAI Gym 和 Tensorflow 实现了大多数标准强化算法,并把它们都共享了出来,方便大家配合教材食用。
简直太贴心。
在这份万星资源里,每个文件夹都对应着教材的一个或多个章节。除了练习和解决方案之外,每个文件夹下还包含了一系列学习目标,基础概念摘要,以及相关链接。
以基于模型的强化学习:使用动态规划的策略迭代和值迭代这一章为例。
这一章配套的是 David Silver RL课程的第三讲,动态编程规划。
首先是学习目标:
设定好学习目标,这份教程还替你划了重点概念。
最后,奉上实战演练。
大框架已经搭好,只需专注重点思考如何填空:
文后附标准答案:
这份教程现在涵盖了以下算法实现。
学习路径如此清晰,这样的优质资源,不Mark一下吗?
传送门:
https://github.com/dennybritz/reinforcement-learning
领取专属 10元无门槛券
私享最新 技术干货