深度增强学习(Deep Reinforcement Learning, DRL)是DeepMind(被谷歌收购)近几近来重点研究且发扬光大的机器学习算法框架。DQN(Deep Q-Learning Network)可谓是深度强化学习(Deep Reinforcement Learning,DRL)的开山之作,是将深度学习与强化学习结合起来从而实现从感知(Perception)到动作( Action )的端对端学习的一种全新的算法。DQN由DeepMind在NIPS 2013上首次发表,后又在Nature 2015上发表改进版。后续又有Double DQN,Prioritised Replay,Dueling Network等进一步改进。本篇主要通过利用DNQ玩儿飞FlappyBird的代码来理解基本的DNQ(NIPS版)、介绍DNQ的核心思想,并对后续的其他改进版本DQN做简单阐述。大部分内容整理自论文和博客。
更多内容可①长按原文地址:http://lanbing510.info/2018/07/17/DQN.html -->②选择复制-->③打开 在浏览器打开阅读。
领取专属 10元无门槛券
私享最新 技术干货