在这个项目中,我们将使用强化学习(Reinforcement Learning)来玩Google的T-rex游戏。RL算法基于Deep Q-Learning算法[1],并在TensorFlow框架中进行实现。
依赖环境
Python 3.5或更高版本
pillows4.3.0
scipy 0.19.1
tensorflow1.7.0或更高
可选:tensorflow tensorboard
安装
本项目已在MacOs,Debian,Ubuntu和基于Ubuntu的发行版这些系统上测试过。首先,我们先克隆GitHub存储库:
我们建议在安装所需的软件包之前创建一个virtualenv。有关如何操作,请参见virtualenv[2]或virtualenv-wrapper[3]。
至于依赖库,我们可以使用pip方式轻松安装。
入门
运行javascript T-rex游戏的Webserver
运行T-rex JavaScript游戏需要一个简单的网络服务器。最简单的方法是使用python的Simple HTTP Server模块。打开一个新终端并导到TF-Rex/game文件路径,然后运行以下命令
打开你本地主机的浏览器,访问127.0.0.1:8000,然后你就可以看到这个游戏了。此方法已针对Chrome和Mozilla Firefox浏览器分别进行了测试。
TF-Rex
记住几个点:
1、通过在终端执行命令:
,所有命令行的参数都可以恢复还原。
2、通过尝试使用预训练的Q-learner玩这个游戏,快速检查安装是否成功。
3、在终端执行命令:
,我们将还原保存在./trained-model文件下的预训练模型,并开始玩T-rex游戏。
4、重要提示:浏览器需要连接到python端。因此,当你执行完下一条命令时,请刷新浏览器
5、如果你想自己训练一个新模型,你可以如下操作
同样,浏览器需要刷新才能启动该过程。作为logdir参数的目录将保存TensorFlow中间变量的检查点和tensorboard信息。
6、在训练模型时,你可以打开另一个终端来启动tensorboard
你可以在主机浏览器http://127.0.0.1:6006/上看到 tensorboard。
参考
[1] 以深度强化学习演奏Atari
[2] Virtualenv
[3] virtualenv-wrapper
============================================
领取专属 10元无门槛券
私享最新 技术干货