首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

DeepZenGo引退棋第1局-芈昱廷 执黑 vs DeepZenGo

来自日本加藤英树团队的老牌计算机围棋强豪——DeepZenGo引退三番棋(电王战)第一局,3月24日在北京进行,对手是世界冠军芈昱廷九段。今年有可能是最后一波正式人机大战的时间节点,因为围棋AI越来越强,成长速度惊人。

如今,拿最顶尖的AI给人类棋手当对手进行正式比赛,就像是在施加虐待,如果不让子,胜负没有悬念;拿次一级的AI给人类棋手当对手进行正式比赛,则成了找BUG和撞大运的游戏,分胜负的地方不在棋艺本身;若再弱一等的AI,那就不知道会发生什么事了,似乎也很难引发足够的关注。

其实,在高配置的单机上运行Zen 7,已经有威胁现役职业棋手的实力。与比Zen 7更弱的AI进行正式比赛,在竞技和宣传上的意义不大。可以把Zen 7看做一个门槛。

在刚刚结束不久的第2届世界围棋冠军赛中,DeepZenGo没有出战。这个比赛本来就是给DeepZenGo量身定做的,签了3年约,预期是三步走:逼近职业顶尖——与职业顶尖不分胜负——超越当代人类棋手可及的水平。第1届的比赛,DeepZenGo达到了第一步,甚至在某种程度上接近了第二步,按理说,可以参加第2届的比赛。

但DeepZenGo团队和比赛的主办方却没让DeepZenGo参加第2届的比赛。去年8月17日,DeepZenGo有战胜绝艺的战绩。而绝艺被认为已经是职业顶尖的实力(注:这是没经过再次升级的绝艺,与职业顶尖棋手互有胜负,胜率肯定超过一半),照此推论,DeepZenGo又过了半年,实力不断提升,应该是稳稳压过职业顶尖棋手一头,或许主办方担心这样的强大AI再去参加第2届世界围棋冠军赛,会让棋手们颜面难堪,出现一场场的吊打场面。

DeepZenGo这一时期提升了多少呢?如果用机器对战刷分的数据看,似乎不太直观。据与DeepZenGo交手最频密的朴廷桓九段说,他认为现在的DeepZenGo比第1届世界围棋冠军赛的那一版DeepZenGo强了一先至两先(不是二子)。在第1届的比赛里,朴九段是几乎输掉的棋,最后DeepZenGo在6目半规则下出现了官子BUG,硬是送出去了,芈昱廷九段的那盘棋也是这么赢下来的,井山裕太之所以输,从某种程度上可能要归因于那盘棋DeepZenGo发挥正常。

假如DeepZenGo修复了官子BUG,再加上朴九段所说的提升了一先至两先的棋力,那么,人类棋手确实没办法跟DeepZenGo下了。第2届世界围棋冠军赛没有DeepZenGo参赛也是正确的决定。

不参加世界围棋冠军赛,代之以三盘引退棋。这次,DeepZenGo宣布引退三番棋的对手——芈昱廷、朴廷桓和赵治勋,正是此前在与DeepZenGo下人机大战正式对局中赢棋的三位棋手,可算是“复仇之旅”了。

今天芈昱廷与DeepZenGo的这盘棋,在赛前,被不少棋友认为是基本没什么赢的可能。

然而,比赛的进程和结果既出人意料,又似乎在情理之中。DeepZenGo在优势了大半盘,下出很多好棋的情况下,再度出现死活判断错误,由此导致官子收错,假妙手变成了送大礼,最终被芈昱廷逆转。引退棋首局饮恨,与芈九段的“旧仇”未了,又添“新恨”。可惜DeepZenGo告别在即,以后恐怕是没机会上演“复仇之战”了。

有棋友笑称,这么看来,DeepZenGo完全可以去参加第2届世界围棋冠军赛嘛,比赛还是很有悬念的,可以仿照去年的赛制,三国围棋第1人+DeepZenGo下循环赛,想夺冠得下至少三盘棋(平分可能需加赛)。

今日的对局,芈昱廷九段执黑,保留时间3小时,是正规的慢棋比赛。DeepZenGo团队的加藤英树老先生这次行程有点小波折,不过总算比赛还是按时进行了。

【下面,我们不是从纯粹的围棋技艺的角度来看这盘棋的,而是以人机之战角度看一看到底这盘棋的胜负是怎么回事】

布局阶段,已经经过AlphaGo Teach演练和Master棋谱熏陶的芈九段下得更像人工智能。比如黑29这手棋,放在三年前,不能说绝对没人敢下,但也一定很稀少。现在嘛,职业棋手都会下这种“机器”棋了,效果也不错。

类似于这种碰或肩冲的棋,并非其计算在人类的能力之外,以前之所以下得少,主要还是观念上的盲点,而这个盲点又往往来自于前辈灌输的定律藩篱。这是人工智能的“创新”思维给人类带来的帮助。

就像点三三一样,以前老师一说到不能点三三,会给你一大堆理由,头头是道。现在再看,那些理由都不成为理由。就是点了,对手能把你怎么样?不能怎么样。你觉得你的外势便宜了,那只是“你觉得”,事实上却没什么必然就便宜的根据。

这种事情在围棋的发展史上曾经不止一次出现过,后辈的天才棋手打破前辈讲述得头头是道的“铁律”,比如任何一个了解点围棋的人都知道的吴清源和木谷实的新布局理论。这次围棋理论的突破,不是由人来做的,而是由人工智能或者说是另一个领域的人类专家以工程技术成果的形式完成的。

芈昱廷 执黑 vs DeepZenGo(布局黑棋更像是人工智能在下)

DeepZenGo最大的问题就是死活判断不清,——并不是总不清,而是不知道什么时候就不清,带有随机性。通常,越是涉及到大区域、多块棋的死活,DeepZenGo出错的概率就大;倘若还有劫争和假眼,DeepZenGo就更容易犯错了。两只眼活棋,这么简单的道理对于DeepZenGo,仿佛永远也拎不清,它有时候秒懂,有时候懵懂。

白70这手棋,如果是人类棋手下出来的,那就是进攻欲旺盛的招法,不敢说一定好,但至少是比较主动。

但DeepZenGo下出这种棋,我们注意到,棋盘左半边有黑白几块棋的死活不确定,而且还可能有假眼,那么,白70就是DeepZenGo在给自己挖坑了——一个搞不清大面积、多块棋死活的选手,非要考验一下自己的弱项。

芈昱廷 执黑 vs DeepZenGo(白70如果是人类在下,是进攻欲旺盛的表现,但是!)

至白106,形势是白棋不错。但是第106手,无论是从人类围棋,还是从DeepZenGo自身特点的角度看,这都难说是什么好棋

白棋当然应该挡住下边,这样很实惠,——人类会这么想。而机器呢?

DeepZenGo显然对黑棋左边的死活有想法,瞄着在什么时候出手攻击。但是DeepZenGo没有更高级的“扬长避短”的思维,它意识不到i自己的弱点是对死活的判断不怎么靠谱,复杂纠缠的大范围死活题时有一定概率发生误判,杀崩的概率是不低的。白106等于是DeepZenGo给自己提供了一个犯错的机会。不如老实收空。

芈昱廷 执黑 vs DeepZenGo(白106无论从人类的角度,还是DeepZenGo的角度,都非好棋)

白棋很凶,到处都想攻击黑棋,四处威胁着要杀棋。涉及到死活问题的棋越来越多。

芈昱廷本来就是这种拼力量的乱战棋风,局面越乱,杀得越凶,他越来劲儿。DeepZenGo呢,也喜欢。如果死活判断不是DeepZenGo的漏洞之源,其实倒也无所谓。

实战到白120的形势是白棋好,但同样也是DeepZenGo很容易犯错的一个局面。

芈昱廷 执黑 vs DeepZenGo(这么下依然是白棋优势,但不确定的地方太多)

至白156,如果让巅峰期的古力或李世石来下这盘棋,继续攻击,或者让巅峰期的李昌镐来下,将优势平稳运转为胜势,估计问题都不大。

DeepZenGo不知道什么是“不得贪胜”,从它的棋里也很少见到“不得贪胜”的风格。在这方面,AlphaGo Master、绝艺和BensonDarr等强大的围棋AI却经常或时常在对局中有所体现,一旦获得优势,它们会将优势平稳运转为胜势。

DeepZenGo则是另一条路。它酷爱通过强烈的进攻继续追击,或一些自以为是的独特定型手法来缩小棋盘,好像一个血气方刚的莽撞毛头小子。

芈昱廷 执黑 vs DeepZenGo(白棋优势赫然,但左边有劫、涉及多块棋的死活判断,是个坑)

保留了大量前AlphaGo时代计算机围棋算法的DeepZenGo在收官时,经常损得莫名其妙,退而不稳,——AlphaGo Master是越退越稳,你没有翻盘的机会,天堑一般。而且DeepZenGo也不是一味地退,可能损着损着,它又突然发飙,在什么地方施展一下手段,想要便宜个大的,甚至动杀心,结果偷鸡不成蚀把米。这种事,我们在DeepZenGo的后半盘看过不知道几次了。

这盘棋是采用日本规则,贴6目半。白棋的优势已经很小了。在这一阶段的定型收官显得很“笨”。

而白226是杀棋的先兆,DeepZenGo对左边黑棋的死活有想法了。

如果是人在下,白226这种棋是很难理解的。如果早有棋,也该早动了,怎么现在突然来劲儿了呢?除非是之前算漏了,现在突然发现有棋。而且下图所示的这个局面,对于人类棋手来说,死活并不复杂。

但DeepZenGo“眼中”的死活与人类棋手判断死活是两码事。之前我们也在讲,涉及到多块棋的死活、较广大区域的对杀,再伴以劫争和假眼,DeepZenGo出错的概率将大增。这一年多来,怎么也克服不了

现在这盘棋的左半边棋盘就很符合上述特征。人类棋手觉得不难,DeepZenGo未必觉得不难。且看DeepZenGo是否再次错判死活,给芈昱廷机会?

芈昱廷 执黑 vs DeepZenGo(白棋的优势越来越小,而且白226是动手杀棋的先兆)

果然,DeepZenGo错看了左边的死活,导致官子连损,最终小败不可避免。如果不是左边的死活产生“错觉”,DeepZenGo也不会这么收官子。至261手,白棋认输。

DeepZenGo的引退棋第一局就挨了当头一棒。

芈昱廷 执黑 vs DeepZenGo(白棋错判死活,官子连损,小败难以避免)

这也再次证明了如果不抛弃旧有的算法,即便是嫁接了部分AlphaGo的理念,也是无法达到同样高度的。反而是后起之秀,如BensonDaar,不需要什么之前的基础,直接照AlphaGo作一遍,迅速达到极高的水平。DeepZenGo的瓶颈成了它无法突破的永久天花板。

引退棋的第二局将在4月1日进行,比赛地点是韩国首尔,朴廷桓出战。我们来期待一下DeepZenGo会不会再犯类似的错误。

去年五月,柯洁与AlphaGo的人机大战第二季引起了新的一波“围棋热”和“人工智能热”。懂不懂行不要紧,哪怕是既不懂围棋也不懂人工智能的人,都能随口说两句围棋和人工智能的话题。柯洁九段也是好风凭借力,将名气从围棋圈子扩展到围棋以外的圈子,成为真正的体育界明星。

划时代的技术出现在计算机围棋领域,各路“机器围棋高手”的实力突飞猛进。从AlphaGo发表在《Nature》的第一篇论文,升级到去年的第二篇论文,两代技术的提升明显,而更重要的是新一代技术更简洁、更高效,也更容易实现,连所需的硬件资源都比前一版更少。说得文绉绉些,大道至简,便是如此。

朴廷桓九段坦承,如今他已经以摆围棋AI的棋谱为主要的学习内容了,人类高手对局的棋谱要摆在第二位。从柯洁九段的对局内容上看,他对AI的棋研究也很多,并吸取了很多局部招法和大局判断上的理念。

后浪奔涌,前浪倍感压力。DeepZenGo的前身Zen曾经多年雄踞计算机围棋界的榜首之位,拿了很多计算机围棋比赛的世界冠军。但AlphaGo出现后,加藤英树团队此前的积累就成了“冷兵器”对抗“热武器”,几乎没有任何优势可言。

从Zen变成DeepZenGo,多加的这个单词Deep是“深度学习”的意思。加藤英树团队也借鉴了AlphaGo的机器学习技术,引入深度神经网络,使得DeepZenGo达到了职业棋手的水准,并经过一年多的发展,进一步达到接近或略高于职业顶尖高手的水准,面对朴廷桓这个等级的高手也能达到六七成的胜率,——朴九段自陈,大致是三四盘能赢一盘。

如果不看DeepZenGo奇葩的收官和那些死活判断的BUG,只看布局和正常进行的中盘,DeepZenGo的棋已经非常厉害了。朴廷桓认为,这已是高明到人类棋手在他这一代无法达到的水准了,自己有时被DeepZenGo的高招震撼到,并努力学习其中的妙处,用在自己的围棋里。

事实上,如果没有新版绝艺或BensonDarr等同类的衬托,DeepZenGo已经达成的成就绝对是很耀眼的。但不怕不识货,就怕货比货。前两者已经接近了AlphaGo Master版本的水平,棋下得很严谨,明显的高棋风范,分先对局,人类棋手的赢棋概率已逐渐变得极低;而DeepZenGo则一如既往地时不时出现死活判断错误、官子莫名其妙、打劫突然就乱了,真眼假眼傻傻分不清楚,等等。这不光是简单的围棋技术失误,而是证明DeepZenGo的算法中存在某些“顽疾”,若不根除,则永远无法避免这种低级错误的反复上演

DeepZenGo表现出来的这种BUG,在围棋技术上看属于“低级失误”,前AlphaGo时代的所有计算机围棋程序普遍存在。因为蒙特卡洛树搜索存在随机性,它本来也不是一个逻辑推衍式的算法,而是一种随机覆盖性质的算法。

理论上,如果计算力无限强,那么随机覆盖与逻辑推衍没有区别,因为可行路线的覆盖率都是100%。

但是,以目前的硬件水平,做不到计算力的无限提升,除非动用超庞大的计算资源,可以达到相对于人类的计算力“远远大于”的程度。不过,哪怕是以AlphaGo Lee的计算力,在人机大战第一季的时候,也出现了第4局的BUG,更别说算法和硬件都明显不及AlphaGo的DeepZenGo了。

AlphaGo解决这些BUG的办法是不做或极少做人工干预,不以打“专家补丁”的方式修复BUG,不储存“人类专家知识库”作机器法则的补充,而是让机器自己学习和修正,而且尽量减少原有算法中的“人类智慧积累”因素,直至达到几乎“纯净”的机器学习版本,只输入基本规则,这就是AlphaGo Zero和AlphaZero。这也是为什么AlphaGo被称为围棋人工智能、而非传统的计算机围棋程序的理由,它可以自己学习、自己修正、自己提高,并在围棋领域具有超越人类的创新能力。

而DeepZenGo则走了完全相反的路。加藤英树团队一方面把深度神经网络引入自己的Zen的算法中,另一方面又大量保留旧有的算法框架。它很像是“Zen学为体,西学(AlphaGo)为用”思路。

加藤英树老先生的坚持,是对自己过去九年取得成绩的信心和坚守。“我们要做一个不同于AlphaGo的围棋人工智能,走出我们自己的路和风格,不作AlphaGo亦步亦趋的跟随者!”

话语体现风骨,老先生能坚持这么多年,值得敬佩

客观事理不因人的精神可贵而变移

DeepZenGo升级后的第一次人机大战是三番棋对赵治勋九段,一度在布局和前半盘下出了令这位围棋传奇都感到敬佩的招法,但后半盘的死活判断和官子实在堪忧,结果1-2落败,这是2016年的事了;

到了2017年3月,第一届世界围棋冠军赛,DeepZenGo在面对芈昱廷和朴廷桓时,以强势的前半盘和中盘力量取得距胜利一步之遥的胜势,结果官子下错,不停地损目,直至输棋,如此低级的失误,让“围棋人工智能”显得一点都不“智能”;

而后被邀请参加第三届梦百合杯世界围棋锦标赛,这是人工智能第一次参加人类棋手的正式世界大赛,大概也是唯一一次,赞助方的倪总为了邀请DeepZenGo顶住了来自各方面的压力,甚至愿意为此给棋手专门提供奖金作补偿,结果首战告捷赢了李世石的弟子申旻埈,第二局却再次出现低级错误输给中坚棋手王昊洋,这也是王昊洋职业生涯中或许是唯一一局可能历经岁月冲刷后被众人铭记的一张棋谱;

之后,DeepZenGo又曾在一些人机比赛中出场,有胜有负,难言稳定。

DeepZenGo频频显出难以克服的不足,赶不上围棋人工智能最高水平的潮流,这已经是明眼人都看得出的现实。DeepZenGo可以下出很漂亮的围棋,在一些招法和大局观上超越人类顶尖棋手,却始终无法避免低级错误的时隐时现,自然也就无法更上一层楼了

从内心情结上,我们完全理解加藤英树团队对DeepZenGo过往的辉煌和积累心存不舍。如果抛弃前尘往事,另起炉灶,做一个“纯净”的机器自我学习的版本,走纯粹的AlphaGo Zero之路,这似乎是对加藤英树过去9年多的工作的一种离弃,使得DeepZenGo与那些后起之秀的AI们没什么不同了,都成了AlphaGo的“后裔”,对加藤英树来说,这大概也算是一种“泯然众人”吧。

加藤英树先生很有个性,也很坚持,否则很难在资源和经历有限的情况下,作Zen的项目这么多年。说割舍就割舍掉过去的成果,说“那些已经过时了”,心理上很难接受。

但如果不割舍,还是在旧有Zen的体系上,做杂糅混合+细节修补,明显是无法超越.......不要说超越了,连达到AlphaGo Master的水平都做不到。

这实在是太纠结了。

类似的事情在人类历史上也有。比如有些文明中心,曾经非常辉煌,曾经长时间内拥有世界上最先进灿烂的技术和文化,曾经他们的思想和治世之道也胜过其他文明中心。但当新的时代大潮席卷,无论是科技、思想、文化还是其他什么东西,都有了极大的发展,新的文明中心崛起了,旧的文明中心衰落了。旧的文明中心很矛盾,它吸取了一部分新文明中心的东西,却又不肯放弃自己就有的很多传统。因为它觉得,如果放弃了,自己就不是自己了,那还有什么意义呢,这很有道理;可是如果“取人之精华,亦存吾旧有至精华,融于一体,岂非大善”,说起来好听,这是纸面上的最完美做法,但实行起来真的可行吗?想取其精华去其糟粕,就能准确地取其精华去其糟粕?保留传统积淀的文明之精华的同时,就必然保留其糟粕;吸收外来文明的精华,抛弃外来文明的糟粕,也只是自以为的;阉割过的精华还是不是足够精华,抛弃的糟粕就真是糟粕吗?文明是一个系统,不是谁想剔什么就剔什么的,这又不是酱骨架。结果便是,旧的文明中心同时保留着传统的精华与糟粕,而从外吸收的新文明中心的精华既不充分也不能顺利扎根,还要时不时与旧传统发生碰撞和矛盾,拖累了前行的脚步。由此,旧的文明中心想要雄心勃勃赶超新的文明中心,这并没有那么想当然地容易实现。没错,这就是希腊、印度和埃及面临的困境。当然,现在最先进的文明中心,未必很多年之后还最先进。到时候,他们也可能面临旧文明中心经历过的这些问题,历史上的轮回可不少。

不管DeepZenGo是否在这次的引退之后再不露面了,我们都感谢加藤英树团队对围棋所做的贡献,感谢Zen系列和DeepZenGo对人类围棋和计算机围棋的贡献。DeepZenGo在最近两年,留下了大量的棋谱,很多招法值得回味和研究。单机版的Zen是真正走进棋友们家中的围棋软件,帮助大家提高技能,体尝下棋的快乐,是个召之即来、随时能战、随时能休战、不会发脾气、不会耍赖的好对手。

引退战的不完美,也许正是DeepZenGo发展历程的完美总结。

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180324A1HMAS00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券