PhoenixGo
来源:公众号 微信后台团队 作者:微信翻译团队
开源地址:
https://github.com/Tencent/PhoenixGo
去年DeepMind的AlphaGo Zero论文发表之后,我们惊叹于Zero强化学习算法的优雅、稳定和高效。恰好当时微信资源调度团队研发了一个大规模云计算平台,利用微信后台闲时的计算资源做机器学习的推理及训练。出于测试自研大规模云计算平台和研究AlphaGo Zero算法的目的,几名工程师陆续加入PhoenixGo这个项目,把论文上的算法一步步变成了一个“活的”、具有职业棋手棋力的AI程序。从1月底开始,PhoenixGo以BensonDarr(昵称“金毛”)的名义在腾讯野狐围棋平台上和全球顶尖职业棋手、围棋爱好者及各路围棋AI对弈,在4月底取得了200多连胜,并在福州2018世界人工智能围棋大赛上夺冠。
AlphaGo Zero需要海量的计算资源来生成棋谱,PhoenixGo复用了微信后台成千上万台CPU服务器的空闲时段得以成长,但这种量级的计算资源很难被普通大众所获取。为了其他研究者可以在我们的基础上继续探索围棋AI的奥秘,为了棋手可以更方便地研究围棋AI的棋路,也为了众多围棋爱好者在家用普通电脑上可以享受和职业九段手谈的乐趣,我们决定开源PhoenixGo对弈源码和训练好的模型。
从福州比赛回来后我们开始着手PhoenixGo的开源。经过一周多时间的源码整理,这次我们开源PhoenixGo对弈源码和一个20 block的模型。训练源码和其它源码由于跟微信内部的云计算平台耦合较深、不易分离,暂不开源。这份源码和模型可以在单块GPU上提供强职业棋手的棋力,在单机多卡和多机多卡的系统上具有远超人类棋手的水平。我们在野狐围棋平台上的账号“金毛测试”,运行于1块性能与GTX 1080 Ti性能接近的Tesla P40上,对人类棋手具有非常高的胜率。
最后感谢DeepMind发表了AlphaGo Zero论文,让一个不懂围棋的技术团队能开发出PhoenixGo;感谢陪伴@野狐围棋、Cronus@弈城、cronus@cgos成长的对弈棋手、AI程序以及广大围观棋迷!
百万总奖金!2018腾讯世界人工智能围棋大赛规程
2018腾讯世界人工智能围棋大赛
文章来源:腾讯野狐围棋公众号
一、主办单位:
中国围棋协会
腾讯科技(深圳)有限公司
二、承办单位:
北京野狐世纪技术有限公司
三、比赛时间:2018年6月到7月
四、比赛办法:
6月23日到24日:预赛(现场),进行5到7轮(根据实际报名队伍数而定)瑞士积分编排赛,前8名进入循环圈;
7月上旬:8强循环圈(网络),在腾讯野狐围棋平台上进行7轮循环圈比赛(每轮执黑、白各1局),前4名进入现场总决赛;
7月下旬:总决赛(现场),半决赛5番棋胜者进入决赛;决赛7番棋决出最终冠军。
五、比赛奖金及补贴(人民币,税前)
(一)比赛奖金
总奖金:116万元;
冠军:40万元;
亚军:20万元;
第3到4名:12万元;
第5到8名:6万元;
第9到16名:1万元。
(二)交通食宿补贴
每队2人,补贴交通费用,包比赛当地食宿。每队超额人员需要额外补交食宿费用。
(三)海外队额外补贴
预赛进入前16名的非中国大陆参赛队将获得额外补贴:(总决赛无额外补贴)
1、亚洲地区参赛队每队额外补贴1万元
2、非亚洲地区参赛队每队额外补贴2万元
六、参赛办法:
自由报名,报名渠道:
报名条件:
(一)棋力:参赛程序需要获得过世界人工智能围棋比赛(最近3年)前8名的成绩,或者棋力在腾讯野狐围棋平台9段及以上;
(二)原创性:参赛程序需要具有原创性并拥有程序源代码(如果是开源软件则只能是原作者或授权人参加,一种开源软件最多只能报名1支队伍)。
七、比赛规则和环境标准
(一)比赛采用19路棋盘,最新中国围棋规则,黑贴3又3/4子,迟到15分钟及以上判为该局弃权;
(二)累计弃权2局及以上判为本届比赛弃权,并自动放弃比赛奖金;
(三)由裁判长辅助判断终局和数子,三劫循环等重复局面判为和棋;
(四)比赛用时:
1、预赛、8强循环圈、半决赛:基本用时30分钟,5次1分钟读秒,超时判负;
2、决赛:基本用时1小时,10次1分钟读秒,超时判负;
(五)预赛名次计算方法:
1、比较各队积分,积分高者名次列前;
2、积分相同则比较各队对手积分总和,积分总和高者名次列前;
3、对手积分总和相同则比较相互胜负,胜者名次列前;
4、依然无法决定名次则加赛决定名次。
(六)8强循环圈名次计算方法:
1、比较各队积分,积分高者名次列前;(每轮2局,胜者得2分、负者得0分,打平则双方各得1分)
2、积分相同则比较相互胜负,胜者名次列前;
3、依然无法决定名次则加赛3番棋决定名次。
(七)总决赛如最终总比分打平,则进行加赛,直至决出胜负。
(八)每局比赛允许3次故障处理的机会,每次最多10分钟,故障处理时间不计入比赛用时。网络对局时掉线即自动进入故障处理状态,现场对局时需向裁判提交申请。裁判有权询问、了解故障详细情况。
(九)比赛默认采用TCP/IP网络通信协议和GTP围棋文本协议;也可由人工摆棋,人工摆棋时间计入比赛用时。
(十)所有着法必须由人工智能程序产生,不可人为修正。
八、具体报名方式
请于2018年6月15日前将以下详细信息发往大赛官方邮箱,回复确认后视为已报名成功:(报名表格见附件)
(一)人工智能围棋程序名称;
(二)所有作者的全名、国籍、排序以及是否出席现场赛(现场赛至少需要1人出席);
(三)通讯责任作者的详细职务信息、手机、邮箱、即时通讯工具及帐号;
(四)智能程序代表的单位信息(如空缺则以通讯作者个人名义);
(五)原创性技术声明(请声明程序的原创性或开源程序的授权说明);
(六)现场能源需求(如有特殊硬件要求如大功率电源请标明)、远程连接与网络需求;
(七)通过GTP协议连接局域网的兼容性说明;
(八)参会起止时间,食宿特殊安排说明。
九、未尽事宜,另行通知;本规程解释权归腾讯科技(深圳)有限公司。
领取专属 10元无门槛券
私享最新 技术干货