最近AlphaGo太鸡儿火了了,于是咱也去凑一把热闹。
AlphaGo算法最初对战李世石的时候使用了一些围棋棋谱进行了监督学习。两个月前DeepMind又推出了AlphaGo Zero算法,把它改进成了不需要棋谱数据的无监督学习。上个月再次推出了Alpha Zero算法,用来下国际象棋。
接下来的一系列教程将会一步一步的教大家使用python,完成AlphaGo Zero算法。由于个人计算机算力的问题,我们在这里学习五子棋这样一个简单的任务。
这一系列教程由 部分组成:
1、什么是蒙特卡洛树搜索
2、自己用python手写一个五子棋类
3、蒙特卡洛树搜索五子棋AI
4、ResNet
5、AlphaGo Zero算法详解
6、使用Pytorch制作AlphaGo Zero
7、给五子棋加上一个看得过去的UI吧
领取专属 10元无门槛券
私享最新 技术干货