根据介绍,DeepMind使用了强化学习(reinforced learning)来促进AI学习游玩精简版《雷神之锤3:竞技场》多人夺旗模式。这些机器人们已经通过“内战”游玩了45万场多人模式,每一场比赛都在系统生成地图上进行,持续时间在5分钟左右。根据外媒编辑的估算,AI的游戏时长已经达到了37500个小时。
根据外媒The Verge报道,DeepMind与另一个人工智能OpenAI不同,它并没有加载《雷神之锤3》原始数值数据,而是采用了一种和人类玩家近似的方式——通过“视觉”来吸收信息。
DeepMind的各个终端并没有接到任何指示,它们在游戏中进行多机竞技,直到确认并能重现出游戏中的多种路线从而获取胜利为止。据称机器人们也学会了埋伏、gank、守旗等等战术。
为了检验这些机器人的能力,研究者们也举行了相关竞赛赛;参赛队伍共有三种组成形式,第一种是两名人类玩家组成的小队、第二种则是两名机器人组队,还有一种则是机器人和人类玩家组队。最终全员为机器人的小队胜率达到了74%(据称《雷神之锤3》老手玩家的胜率在52%左右,普通玩家则是43%)。当队伍里有4名机器人时,胜率就会跌至64%。但是这个胜率依然要高于人类的平均水平。 (游民星空)
领取专属 10元无门槛券
私享最新 技术干货