【新智元导读】CMU的AI“Libratus”以绝对的优势在单挑无限德州扑克中赢得了人家职业玩家,这无疑是AI发展史上的一座里程碑,就像日前谷歌CEO Brin 在达沃斯论坛上表示的那样,AI发展如此之快,超出我们的想象。不过,这次CMU的AI更多是依靠暴力计算而非深度学习取胜,与AlphaGo战胜李世石的意义十分不同。我们离真正的机器智能还有很长的距离。下面就从获胜的 Libratus 使用技术的最新论文开始看起。
摘要
与信息完全对称的博弈不一样,信息不完全对称的博弈不能分解为独立解决的子游戏。因此,使用更加计算密集的 equilibrium-finding技术,进而生成和解决较小版本的,也就是简要版本的游戏,这是非常必要的。
终局游戏的解决方案(Endgame solving),指的是计算(理论上)更好的策略,但是只是面向终局游戏,而不是整个游戏中所需要的计算能力。Endgame solving 有很多优势,比如能够1)在一个更精细的信息抽象中解决终局游戏,而不是整个游戏计算上可行的游戏; 2)结合到对手所采用的终止游戏中的动作抽象用来解决整个游戏。
我们介绍一种在博弈理论和实践中胜过先前方法的终局游戏解决技术。我们还展示了如何采纳它,并通过过去的解决方案,来响应原始动作抽象之外的对手行为,这明显要优于当前最先进的方法。
最后,我们展示了在游戏进行的过程中,终局游戏的方案可以不断重复,导致明显降低了可利用性(exploitability)。所有的技术都根据可利用性进行评估。
据我们所知,这是第一次在大型不完全信息游戏中评估了游戏解决技术的可利用性。
10天前,在达沃斯论坛2017年年会,Sergey Brin 与一名采访者坐下来谈论人工智能(AI)和未来(视频:https://www.youtube.com/watch?v=XzkUAxtEQXE)。Sergey Brin 是谷歌的联合创始人之一。他谈话间的语气深思熟虑,但很柔和,主要因为他是一个聪明而且周到的人。在被问及人工智能的未来时,他明智地回答说“不可能准确地预测”,随即讲了他自己的一个故事。
十年前,Brin 还在主管谷歌的X实验室,那里的项目成功的几率是百分之一。有一个专注于 AI 的小项目叫 Google Brain。“坦白说,”Brin 说,“我那时根本没有注意到它。”Brain 项目由一名名叫 Jeff Dean 的计算机科学家领导,Brin 回忆说:“他会定期地来找我,说,‘看!计算机做了一张猫的图片!’我说,‘好好,这不错,Jeff,回去做你的活儿,什么都好。’然后快进几年,现在Brain 几乎触及了我们的所有主要项目——从搜索到照片到广告……触及了谷歌的所有业务。深度网络的这场革命非常深刻,而且让我感到惊讶——哪怕我就处在这场革命中间。”
快进一周,从达沃斯的那次采访,让我们把镜头切换到匹兹堡,四位顶尖的职业扑克玩家正在用他们的智慧与一个由两位CMU研究人员开发的 AI 程序作战。比赛的内容是一种特殊的高赌注扑克牌,称为一对一无限注德州扑克。该 AI 程序名为 Libratus,在拉丁语中的意思是“平衡”。然而,它一点也不平衡。在20天的比赛中,Libratus 已经赢了$800000,让人类对手开始感到沮丧。参加比赛的职业玩家之一 Dong Kim 说:“直到今天我才意识到它(AI程序)有多厉害。我觉得我在和一个会欺骗人的对手打,它好像能看到我的牌。我不是指责它作弊,它只是太厉害了。”
人工智能已经走过了另一座里程碑,匹兹堡大赛表明,一台机器可以在面对真正的人类扑克专家选手时,也能玩出一场表现相当的比赛。这件事情意义重大,因为扑克所需要的推理和智能机器是没有的。扑克中没有单一的一个最佳选择,机器必须不断改变其战术,确保对手难以发现它什么时候是在虚张声势。MIT TR 编辑、机器人专家 Will Knight 说,“扑克从根本上不同于跳棋、国际象棋或围棋,因为对手的牌在对局过程中一直是看不到的。在‘不完整信息博弈’中,考虑到你的对手可能采取的每一种可能的方法,并找出理想的战略是非常复杂的。而无限注德州扑克尤其具有挑战性,因为对手可以赌任何金额。”
匹兹堡比赛肯定会在通往某种AI的道路上的一系列重要阶段中占据一席之地。早些时候,包括1997年 IBM 的深蓝战胜国际象棋大师加里·卡斯帕罗夫,同样是 IBM 的 Waston 2011年在问答游戏 Jeopardy!中获胜,还有2016年3月 DeepMind 的 AlphaGo 击败世界围棋冠军,每一个都可以被视为一项惊人的成就,但在现实中,这些都只是一段很长的旅程中的最初几步而已——虽然现在关于“超级智能”的炒作随处可见。
那么,我们如何对 Brin 在达沃斯遇到的问题做出明智的评估呢?研究界喜欢用的一种方式是将 AI 区分为两种——强 AI 和弱AI。强AI意味着具有人类能力的感知、自然语言、推理和运动控制能力的机器。弱AI就是我们现在的AI——让亚马逊或Netflix猜测你可能想要购买或观看内容的东西,让谷歌用来“自动完成”搜索查询的东西:换句话说,机器学习和大数据。所以在某种意义上,你可以说AI的未来已来。另一方面,实现强 AI 似乎还有很长的路要走。AI 领域的真正大师之一,Geoffery Hinton 认为在他的有生之年不会看到强AI的实现。虽然 Brin 现在只有43岁,他或许也不会看到强 AI 的实现。