AI机器人与人类选手对决电竞赛场,最后赢的会是谁?
今日凌晨它又刷新了自己的高度——2:1完胜Dota 2“传奇五将” ,平均水平超过了99.95%的Dota2玩家。
(图源:OpenAI)
人工智能机器人OpenAI Five此前就曾在视频游戏Dota 2中一举打败人类选手,但这是OpenAI Five首次在5v5战局中,对上职业选手。人类代表队由职业和半职业选手组成。这几位人类选手分别为Blitz、Cap、Fogged、Merlini和MoonMeander,是欧美Dota 圈耳熟能详的主播、解说和前职业选手和现役职业选手。
在三个游戏系列中,OpenAI Five强势启动,前两场比赛以压倒性优势。在第二局接近尾声时,Dota Plus大数据就对对人类战队宣判了死刑——AI胜率100%。
在最后一场比赛中,OpenAI团队让观众选择了他们的5位英雄组成团队,严重阻碍了这位机器人霸主,颇有“挽回人类尊严”的味道。这种障碍导致机器人预测它只有2.9%的机会赢得比赛。最后OpenAI Five以2-1的战绩登台称王。
与一个多月前的5V5镜像英雄Dota2比赛不同,这一次,OpenAI不仅扩大了英雄池,允许双方以随机征召模式挑选英雄(无禁用),而且将AI系统的反应速度从80ms增加到了200ms,更接近人类的反应速度,同时还移除了此前多种对人类不利的限制,从而让他们更好地使用各种“手段”。不过,5位选手此前并未联手作战过。
在过去的一个月里,OpenAI团队对他们的神经网络机器人进行了一些小的调整,增加了它的反应时间,并通过新的额外策略实现了它的步伐。短短一个多月,OpenAI战队就掌握了这些英雄、操作和相应的对策。
OpenAI的研究人员David Farhi表示,“当发生令人震惊的事情时,他们的反应似乎还要快得多”,他认为这可能是机器人对人类团队的一个优势。
OpenAI Five由非盈利组织OpenAI开发,它使用中立网络和机器学习来教自己玩Dota 2,每天的训练量甚至已经接近180年的游戏时间。该系统的初步版本曾在2017年击败过Dota的1v1版本中排名靠前的专业选手战队。
该系统包含了256个GPU和12.8万个CPU(谷歌云平台),通过近端策略优化(PPO)算法,24 小时不间断地进行自主对抗。
(图源:OpenAI)
OpenAI Five之间是怎样配合的呢?他们之间没有那种人类可以理解的沟通渠道,而是由一个“团队精神”超参数来统一控制。这个超参数的范围在0到1之间,决定了选手对与自身奖励函数和队友平均奖励函数的关注程度分配。
OpenAI操作也一样是通过bot API,能够移动位置、攻击、使用道具,根据获胜、血量和补刀情况得到奖励。
“我对OpenAI Five有信心,我认为它会击败职业战队。”选手之一"Blitz" Lee当场表示。
目前,OpenAI Five游戏仍然存在一些限制,因为神经网络逐渐建立在其知识基础之上。随着国际赛将于8月20日至25日举行,OpenAI Five机器人战队只需几周的时间就能为世界上最好的电竞选手。
在2:0击败人类队伍后,OpenAI的CTO Greg Brockman宣布,“我们的系统已经准备好在TI8上面对顶尖职业队伍了!”
在此前击败人类业余队伍后,OpenAI曾承认,他们在项目最初也没有料到——全无基础的强化学习会达到如此高度。训练全程未使用人类选手的数据,也没有搜索和观看人类游戏的录像,全靠“自学成才”。
无论是OpenAI Five对阵Dota 2,还是DeepMind Alpha Go决胜围棋冠军,人工智能都做出了一些人类难以理解的举动
领取专属 10元无门槛券
私享最新 技术干货