首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

姿势分子:当AI学会思考 我们还能欢乐地玩游戏

2016年1月28日,又是人工智能历史上的一个大日子。这天著名国际科技期刊《自然》杂志的封面论文《通过深度神经网络和搜索树精通围棋》如一石激起千层浪,同时在计算机界和围棋界掀起轩然大波: Google DeepMind开发的人工智能程序AlphaGo(顺带一提,围棋是英文就是“Go”,从日语翻译过来的)以5:0吊打了欧洲围棋冠军樊麾。虽然说欧洲作为围棋荒漠,其冠军也不过是职业二段,而且事后中国棋院的职业选手也认为:主要是樊麾久疏战阵下得不好、AlphaGo的实际水平大概相当于职业入门的水平。但这围棋AI的恐怖之处在于,哪怕不升级算法,也能在不断的对弈中提升实力,遇强愈强。类似于人——或者说更类似于玩家们很熟悉的虫族:吞噬,进化。即便人类当前还有抵抗之力,围棋AI从人类身上碾过,不过是时间问题而已。

那么,为什么在围棋上计算机战胜人类会引起这么大的轰动?这项成果又能用到哪些方面?

本期《自然》杂志的封面

人类智慧的皇冠

让我们回到19年前,1997年5月11日,随着手持长枪短炮的记者们的一阵骚动,IBM公司研发的超级国际象棋电脑“深蓝”在连续三盘和棋后,终于在第六局取胜,以总分3.5:2.5战胜了当时在国际象棋领域独孤求败的卡斯帕罗夫,宣告计算机在国际象棋项目上完成对人类的超越。

计算机的崭露头角在当年轰动一时,也引起不少人对于AI取代人类的恐慌,甚至在随后的几年衍生出了大批电影和文学作品。尽管在深蓝与卡斯帕罗夫之战后一段时间内还有人类战胜或者打平电脑的事例,但随着计算机性能的快速提升,终于在2006年之后,便再也没有人下得过电脑了。自此,人类在棋类游戏中的堡垒,仅剩围棋一座。

为什么是围棋而不是象棋,也不是陆战棋?围棋到底有何特别之处?

一点是围棋有着极为丰富的下法,随着中国古代围棋在四个角星位放四个棋子限制局面的“座子制”被废除,今日围棋19×19的棋盘上没有任何的限制,不似象棋有着规定的排兵布阵,棋子也不需受到只能在某个特定的方向走特定的步数之类的限制,只要你喜欢(以及对手配合),甚至用棋子拼几个字母打广告照样在规则准许范围之内。

极为自由的下法带来的是恐怖的局面可能性:只从明面上看,就有3的361次方种下法,远超宇宙的原子总数,再加上打劫和提子等技巧,围棋的局面走势可以用“无限”来形容,因此围棋素有“千古无同局”的美誉,这也就让“算出所有的局势并挑选最佳路线”的计算机下棋方式在围棋面前一筹莫展。

中国古代围棋中的“座子制”

当然,电脑下棋也往往不会将所有可能的路径列出来再挑选,这样太浪费机能和时间了。一般会用算法排除掉明显没用的路线,在剩下的可能性中选择最佳方式走棋。这里就体现出围棋的另一个精巧之处:一般的棋类只要干掉对方的国王/将军/司令之类,因而可以轻松排除掉无用的路线,围棋却没有明确的目标和结构,一子之差就能让盘面上的局势天翻地覆:每一步棋都可能是有用的,导致不仅每一步棋都有着数百种下法,而且还无法排除,计算机也就迟迟不能攻占这人类智慧的最后堡垒。

但是,既然人可以下好围棋,也就证明,围棋虽然没什么易于直接总结的规则,但冥冥之中还是有规律可循,只是不容易总结而已。于是研究人员就想到,只要让计算机也学会人类的思考方式,照样可以下得好。DeepMind 的研究人员就祭出了“深度学习”技术,即是让计算机用人类的方式来下棋,在不断下棋中评估局面,抛弃那些送子的自杀式下法,同时估计在未来20步中下在哪里取得优势的概率更高,每局下来都可以积累更多的经验,从而让自身的概率估计更为精准。

AlphaGo对局势的估计

在经过无数高手棋局的训练和自己跟自己对弈500万局之后,AlphaGo 的实力就达到了职业水准,而且还可以进一步提高。

今日的智能

啊,好像是扯得有点远了,我也不是来播报新闻的,既然是游戏网站,那接下来就该说一下这项技术除了用来下围棋以外,还能跟游戏扯上什么关系。

要理解这点,我们就首先要知道现在我们玩的游戏里的AI是什么机制,这样我们才能知道深度神经网络能让AI发生什么改变。今天我们玩的电子游戏,无论是星际2、War3、老滚4、文明5,不管游戏方式再千奇百怪,其AI用的都是同一套行为逻辑——“有限状态机”。

听起来很高大上的样子,不过实际上我们也用不着深入剖析,简单而言,就是让游戏AI对于一定的情况选择一种应对方式。比方说,LOL和Dota的电脑AI会设置为,当其血量低于玩家一套技能伤害时就会自动往后退或者回城,FIFA的AI会自动传球给当前状况下得分成功率最大的球员。如果说一场游戏里可能出现的所有状况就是一张试卷的题库,那么有限状态机就是参考答案库,一旦出现某种“题型”,就挑选出相应的“答案”。虽然实际情况复杂得多,要用上很多层的状态机环环相扣,不过究其本质,都是这个机制。

这套机制的确实用又好用,以至于电子游戏业界数十年如一日地坚持使用,一路欣欣向荣,在这套原理的基础上发展出更多更好更复杂的AI。然而,盛世之下也潜伏着危机,有限状态机始终有几个与生俱来的缺陷并限制了游戏内容的发展。

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20171227C0AGWH00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券