前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >腾讯 AI「绝悟」KPL 击败职业玩家联队,晋升王者荣耀电竞职业水平

腾讯 AI「绝悟」KPL 击败职业玩家联队,晋升王者荣耀电竞职业水平

作者头像
机器之心
发布于 2019-08-05 07:51:39
发布于 2019-08-05 07:51:39
2.1K0
举报
文章被收录于专栏:机器之心机器之心

机器之心报道

参与:泽南、杜伟

昨天下午,腾讯策略协作型 AI「绝悟」在吉隆坡举办的王者荣耀最高规格电竞赛事 KPL 世冠杯半决赛中,通过了职业选手赛区联队带来的水平测试,升级至电竞职业水平。

「绝悟」是腾讯 AI Lab 与王者荣耀团队共同探索的前沿研究项目,在王者荣耀世界冠军杯半决赛的特设环节中,这一人工智能在职业选手赛区联队带来的 5v5 水平测试中获胜,首次在王者荣耀游戏中击败了现役职业玩家。

AI 虽然一度被人类打团灭了,但是仍然在这场 16 分钟的对决中稳稳拿下了胜利。

2018 年 12 月,在王者荣耀 KPL 秋季决赛期间,腾讯 AI Lab 与王者荣耀共同探索的研究项目——策略协作型 AI「绝悟」首次露面,并接受前职业 KPL 选手、职业解说组成的人类战队(平均水平超过 99% 玩家)的水平测试,最终绝悟获得胜利。昨天,绝悟则是击败了由四名中国选手和一名马来西亚选手组成的职业联队

比赛视频,从 3 分 40 秒开始:

OpenAI Five 在 Dota2 上挑战职业战队失败在先。在比赛之前,研究人员们对「绝悟」有没有信心呢?腾讯 AI Lab 技术团队告诉机器之心:「根据之前的内部基准测试判断,我们认为胜算还是比较大的。但这是「绝悟」第一次接受赛区联队的测试,不到最后一秒,很难说我们是有完全把握的。整场测试里,职业选手表现出非常高的水准,精彩度极高,「绝悟」测试表现中体现的策略和协作能力与日常测试相似,我们也很满意。」

此次,绝悟对阵的五个人类对手均为现役职业玩家:eStar Pro 的兮兮、EMC 的 Sun、Nova 的 Seek、KingZone 的 Night,以及马来西亚选手 M8HEXA 的 Mike。

在比赛中,蓝方为人类战队,红方为绝悟。人类选择了曹操、娜可露露、武则天、狄仁杰和张飞的阵容;而人工智能控制达摩、雅典娜、王昭君、虞姬和牛魔五个英雄。

腾讯 AI Lab 表示,此次比赛是固定的十个英雄,不过职业选手可以自由出装。开发团队希望能在未来不断扩大英雄池的规模。

人机大战对阵双方的阵容。

另一个人们关心的话题是 AI 的手速限制。腾讯 AI Lab 表示,绝悟的设定为跟人类极限手速类似,因为游戏本身普攻和技能都有攻速限制,因此总体是一个相对公平的比赛。

人类拿下一血、团灭 AI,但无济于事

人工智能依靠完全自我博弈形成的战术,与人类玩家大有不同。在比赛中我们可以看到 AI 并不拘泥于上单、中路和下路英雄的不同「职位」,而是致力于打钱效率的最大化,每个英雄获取金币的数量也趋于平均。另一方面,即使是坦克英雄,购买的装备也倾向于攻击性。

开局时「绝悟」没选择传统人类对线走位策略,而是由双 C 位英雄虞姬和王昭君先一起清理中路第一波兵线,压制敌方中辅。之后又转上路压制曹操血线。

与此同时,「绝悟」方雅典娜和牛魔合作拿下己方首个蓝 buff,转战中路击杀小兵补血,再联手拿下己方首个红 buff。

随着比赛的进行,「绝悟」方虞姬、雅典娜和牛魔与「人类」方曹操和武则天展开混战,双方战至上路,曹操越塔强杀虞姬,拿下「人类」方一血。

比赛进行到 4 分 10 秒,「绝悟」方虞姬、王昭君、达摩和牛魔全部压制中路,而「人类」方曹操被杀掉半血,而妮可露露被达摩一个回勾拳击杀,「绝悟」扳回一城。

团队协作:「绝悟」四人追击娜可露露,AI 达摩一脚将娜可露露反踢入 AI 群中,再由四个 AI 完美配合拿下自己的首杀。

之后,「绝悟」方虞姬、王昭君、达摩和牛魔继续抱团上路推进,拿下「人类」方上路二塔;「绝悟」方雅典娜单带下路,被「人类」方狄仁杰和张飞联合击杀。

在比赛进行到第 9 分钟时,人类玩家抓住 AI 打主宰的机会,武则天开大制造了 AI 的一次团灭。然而随后人类玩家并没有将优势转化为胜势——仅仅拆掉了 AI 中路的二塔。

游戏进入中期,人工智能和人类玩家的经济并没有拉开太多。我们看到 AI 的王昭君和牛魔经常会使用大招清兵线——在 AI 的眼里,所有技能都是为奖励机制服务的,重要性没有区别。这一场面此前我们在 OpenAI Five 与人类的比赛中也能看到,所以这一回就连主播们也不再吐槽,转而思考:难道 AI 这么做其实是对的?

......

比赛进行到 15 分 10 秒,来到了本场比赛最精彩的部分。「绝悟」方虞姬、王昭君、达摩和牛魔上路抱团,攻击「人类」方上路一塔,随后双方英雄全部赶到展开混战。

这时,「人类」方武则天放大招,助攻己方狄仁杰击杀掉敌方王昭君,而「绝悟」方虞姬又射杀掉了妮可露露。「绝悟」方牛魔放大助攻己方达摩击杀掉敌方狄仁杰。同时,「绝悟」方雅典娜突进击杀掉敌方武则天。至此,「人类」方英雄只剩下曹操和张飞。

然后,「绝悟」方虞姬顺利击杀掉敌方张飞,而「人类」方曹操回城回血。但曹操一人回天乏力,只能眼睁睁地被「绝悟」方四英雄虐杀掉。

「绝悟」四英雄完美配合,塔下极限击杀。

但在比赛的最后,「人类」方英雄团灭后,「绝悟」再次展示了它人工智能固执的一面:在对方没人,己方兵线已经压到水晶下的时候,却并未选择直接推水晶,而是在计算整体收益后,选择先推掉最后一个高地塔,再推水晶直至胜利。

「人类」英雄团灭后,「绝悟」选择推掉最后一个高地塔。

实现 AI 宏观战略架构

高性能游戏 AI 的研发是算法+算力高度结合,需要极致优化的算力平台和持续改进的优化算法。据腾讯 AI Lab 介绍,绝悟团队部分成员来自围棋 AI「绝艺」的团队,综合了 AI Lab 的科研与工程人才资源,还联合了腾讯技术与工程事业部(TEG)旗下基础架构平台部人才。主要工作包括模型、特征、算力、数据的优化,机器虚拟化、搭建和优化数据处理、并行计算机器学习训练的平台。

从业余顶尖到职业水平,人工智能究竟经历了怎样的提升?据悉,此次测试的「绝悟」版本建立了基于「观察-行动-奖励」的深度强化学习模型,没有经过人类数据的训练,从白板学习(Tabula Rasa)开始,让 AI 自己与自己对战。

「绝悟」的人工智能模型训练使用 384 块 GPU,8.5 万核 CPU,平均每天自对战局数相当于人类训练 440 年的量,训练周期持续半个月以上。AI 从 0 到 1 摸索成功经验,既学会了如何站位、打野、辅助保护和躲避伤害等游戏常识。更有趣的是,AI 也探索出了不同于人类常规做法的全新策略。团队还创建 One Model 模型提升训练效率、优化通信效率,提升 AI 的团队协作能力,使用零和奖惩机制让 AI 能最大化团队利益,使其打法果断,有舍有得。

AI 打王者荣耀游戏的困难之处,在于需要在不完全信息、高度复杂度的情况下作出复杂快速的决策。在庞大且信息不完备的地图上,10 位参与者要在策略规划、英雄选择、技能应用、路径探索及团队协作上面临大量、不间断、即时的选择,这带来了极为复杂的局面,操作可能性预计高达 10 的 20000 次方,而整个宇宙原子总数也只是 10 的 80 次方。

若 AI 能在如此复杂的环境中,学会像人一样实时感知、分析、理解、推理、决策和行动,就可能在多变、复杂的真实环境中发挥更大作用。因此业界认为下一个 AI 里程碑,可能会在复杂策略游戏中诞生。世界顶级科技公司均在推进此类研究,如谷歌 DeepMind(星际争霸 2)、Facebook(星际争霸 2)及 Open AI(Dota 2)等。

在腾讯 AI Lab 去年提交的论文《Hierarchical Macro Strategy Model for MOBA Game AI》中,我们可以了解到「绝悟」背后的人工智能技术。

研究人员发现建模战略阶段对 MOBA 游戏中 AI 的表现至关重要。然而,教智能体学习宏观战略操作颇具挑战性。首先,从数学上定义宏观战略,如围攻和分线推进就很困难。此外,在 OpenAI Five 的强化学习框架上加入宏观战略需要相应的执行才能获得奖励,但学习宏观战略操作本身就是很复杂的过程。

因此,作者认为监督学习是更好的方案,因为可以充分利用高质量游戏的回放来学习宏观战略以及相应的执行示例。需要注意的是,通过监督学习学到的宏观战略和执行可以进一步作为强化学习的初始策略。

(a) 王者荣耀游戏界面。玩家使用左下角的虚拟键控制移动,用右下角的键控制技能。玩家可以通过屏幕和左上角的小地图来观察环境。(b) MOBA 示例地图。双方队伍分别用蓝色和红色表示,每队拥有 9 个防御塔和 1 个基地。四个野区分别标为 1、2、3、4。

MOBA AI 宏观战略模型的设计灵感来自人类玩家的战略决策方式。在 MOBA 游戏中,经验丰富的人类玩家完全了解游戏的每个阶段,如开启期、对线期、游戏中期和游戏后期。在每个阶段,玩家都要关注游戏地图并根据情况决定将英雄派往何处。例如,在对线期,玩家会将更多的注意力放在自己的线路上,而不是支持队友。但在游戏中期和后期,玩家会更加关注团战地点,向敌方的基地推进。

宏观战略操作过程可以总结为「阶段识别-> 注意力预测→ 执行」。为了建模这一过程,作者提出了一个双层宏观战略架构,如阶段层和注意力层:

  • 阶段层旨在识别当前游戏阶段,这样注意力层就能更清楚地知道应该将注意力放在哪里。
  • 注意力层旨在预测地图上适合派遣英雄的最佳地点。

阶段层和注意力层为宏观执行提供高级指导。下文将详细说明建模细节。宏观模型的网络架构几乎与 OpenAI Five 中用到的结构一样,只不过前者是以监督学习的方式。经过一些小幅修改,作者将其应用到《王者荣耀》中。

分层宏观战略模型的网络架构。

(a)在阶段层中建模的主要资源(即图中圈出的防御塔、基地、龙和暴君)。(b)举例说明阶段层中的标签提取。

对于不同类型的英雄来说,最热点的区域(红圈处)也有所不同。

「绝悟」未来可期

「绝悟」名字寓意绝佳领悟力,其技术研发始于 2017 年 12 月,除了亮相 KPL 赛场之外,「绝悟」的 1v1 版本昨天也在上海举办的国际数码互动娱乐展览会 ChinaJoy 首次对公众亮相,向顶级业余玩家开放为期四天的体验测试。据悉,在首日的 504 场测试中,「绝悟」测试胜率为 99.8%,仅输 1 场(对方为王者荣耀国服第一后羿)。

腾讯表示,在强化学习游戏 AI 方面的研究有助于人类在实现通用人工智能(Artificial General Intelligence,AGI)之路上更进一步。腾讯 AI Lab 近期还将通过论文等形式进一步分享更多技术细节。

「应用上,一方面,『电子竞技』将成为策略协作型 AI『绝悟』未来短期内的主要应用场景。借助在算法和数据方面的优势,AI 可为职业选手提供数据、战略与协作类实时分析与建议,及不同强度与级别的专业陪练,」腾讯 AI Lab 介绍道。「另一方面,依托腾讯的丰富资源,我们将进一步开放研究侧资源给到游戏应用中。」

腾讯表示,还有更多细节,将在 8 月 18 日的王者无限开放计划发布会上分享。

腾讯 AI Lab 一直是强化学习研究的先行者。2016 年起,研发的围棋 AI「绝艺」(Fine Art),现担任中国国家围棋队训练专用 AI ;2017 年,启动「绝悟」研发;2018 年,「绝悟」达到业余顶尖水平,腾讯还在射击类顶级 AI 竞赛 VizDoom 夺冠,并在《星际争霸 2》首先研发出击败内置 AI 的智能体。

腾讯副总裁姚星介绍,「电子竞技」将成为策略协作型 AI「绝悟」未来短期内的主要应用场景。作为数字时代最受年轻人欢迎的运动,电竞已于 2018 年成为亚运会表演项目,中国队参赛获两金一银的成绩。与传统体育项目一样,电竞职业选手也需要手眼脑协调、策略和操作快速反应、团队协作精神及大量刻苦训练。借助在算法和数据方面的优势,AI 可为职业选手提供数据、战略与协作类实时分析与建议,及不同强度与级别的专业陪练。以前沿科技推动电竞专业化发展,AI 或许将在未来推动中国电竞在全球范围内保持领先。

「游戏是对真实世界的一种模拟,一种只有一个具体目标的模拟,这正是人工智能学习的绝佳试验场,」腾讯 AI Lab 表示。「但我们的目标从来都不只是游戏 AI,而是希望 AI 在学习如何做上千个小决定后来达成更大的终极目标。研究上,短期仍希望能将 AI 的策略协作提升到极致水平。随着「绝悟」能力不断提升,我们后续也可能会接受顶级职业战队的测试。」

而长期应用上,「绝悟」将是腾讯攻克 AI 终极研究难题——通用人工智能的关键一步。AGI 代表研发能在通用系统中执行多种复杂命令,达到或超越人类水平的 AI,从『绝艺』到『绝悟』,不断让 AI 从 0 到 1 去学习进化,并发展出一套合理的行为模式,这中间的经验、方法与结论,长期来看,有望在大范围内,如医疗、制造、无人驾驶、农业到智慧城市管理等领域带来更深远的影响。

本文为机器之心报道,转载请联系本公众号获得授权。

✄------------------------------------------------

加入机器之心(全职记者 / 实习生):hr@jiqizhixin.com

投稿或寻求报道:content@jiqizhixin.com

广告 & 商务合作:bd@jiqizhixin.com

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-08-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器之心 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
TextView AutoLink, ClikSpan 与长按事件冲突的解决
首先,我们先来复习一下 autoLink 和 ClickableSpan 是干什么用的。
程序员徐公
2018/12/28
2.1K0
微博的文本编辑和显示(emoji表情,@某人、链接高亮点击)
动图效果<( ̄ˇ ̄)/:https://github.com/CarGuo/RickText/blob/master/device-2016-11-10-220253.mp4_1478787046.gif
GSYTech
2018/08/22
2.3K0
微博的文本编辑和显示(emoji表情,@某人、链接高亮点击)
Android TextView 添加下划线的几种方式
本文介绍了在Android TextView中添加下划线的几种方式:1.在字符串资源文件中设置下划线;2.使用TextView的autoLink属性;3.使用Html类的fromHtml()方法;4.使用TextView的Paint属性;5.使用Spannable或实现它的类。这些方法都可以实现TextView中添加下划线功能,具体使用哪个方法取决于具体的需求和实现。同时,还介绍了如何自定义超链接的样式,包括设置前景色、设置下划线样式等。
用户1155943
2018/01/04
5.7K0
【翻译】TextClassification介绍(三)
2018-11-20 by Liuqingwen | Tags: Android 翻译 | Hits
IT自学不成才
2019/01/08
7400
Android P 中的新文本特性
在 “What’s new in Android P Beta” 中我们已经谈到 Android 的两个新文本特性。现在既然 Android P Beta 3 及最终 API均已推出 ,我们也该深入地探究它究竟有哪些新文本特性。众所周知, TextView 是 Android 视图系统中最关键的组件之一。这也是我们一直在面向开发者及用户的特性及 API 改进方面投资的原因。
Android 开发者
2018/08/02
1.7K0
Android P 中的新文本特性
【翻译】TextClassification介绍(一)
2018-10-28 by Liuqingwen | Tags: Android 翻译 | Hits
IT自学不成才
2019/01/08
1.3K0
Android Smart Linkify 支持机器学习
上半周,我们发布了 Android 9 Pie,这是 Android 的最新版本,它的机器学习应用使您的手机更简单易用。 Android 9 中有一项功能是 Smart Linkify,这是一种新的 API,可在文本中检测到某些类型的实体时添加可点击链接。 这个功能很有用,例如,当您从朋友的消息传递 app 中收到一个地址,想要在地图上查找时,如果使用 Smart Linkify-annotated 文本,它就变得容易多了!
Android 开发者
2018/08/28
1K0
Android Smart Linkify 支持机器学习
P1-Android基于MVP实现号码归属地查询
零、前言 [1].最近在总结了安卓的知识点,现在来穿插一个小项目,算是对前面的一个小小总结 [2].本案例是以前在慕课网的学习的一个免费课程,代码看不懂的可以去看看:号码归属地查询实用工具 [3].相比与视频课程,本案例按照我的理解,对项目结构进行了优化。 [4].案例网络模块是自己对okhttp3的封装,当然你也完全可以使用其他的上层网络框架 [5].相比课程,加入缓存机制,使用前面写过的缓存封装:详见:缓存文件封装 [6].使用前面的listview封装类:详见:ListView的封
张风捷特烈
2018/09/29
6790
P1-Android基于MVP实现号码归属地查询
Android自定义TextView实现必填项前面的*号
在res目录下的values目录里新建一个xml文件,取名为attrs.xml,代码如下所示: <?xml version="1.0" encoding="utf-8"?> <resources>
longzeqiu
2020/04/24
1.7K0
android学习笔记----ListView和各种适配器简介
将数据库显示到ListView的小Demo源码地址:https://github.com/liuchenyang0515/ListView_DataBase
砖业洋__
2023/05/06
2.4K0
android学习笔记----ListView和各种适配器简介
Android技术栈(四)Android Jetpack MVVM 完全实践
本文包含Android中MVVM体系中的很多部分,主要对ViewModel+DataBinding+RxJava+LiveData+Lifecycle等笔者所使用的技术体系进行解析.
Android技术干货分享
2019/04/18
4K0
Android技术栈(四)Android Jetpack MVVM 完全实践
老司机带你重构Android的v4包的部分源码
版权声明:本文为博主原创文章,未经博主允许不得转载。https://www.jianshu.com/p/a08d754944c4
AWeiLoveAndroid
2018/09/03
8780
老司机带你重构Android的v4包的部分源码
【翻译】TextClassification介绍(二)
2018-11-15 by Liuqingwen | Tags: Android 翻译 | Hits
IT自学不成才
2019/01/08
6370
ViewModel浅析
这样通过点击MasterFragment的按钮就能控制DetailFragment的文本了。其实SharedViewModel就是一个中转站,一个仓库,一个存一个取。因为很多通信其实都是通过底层存储来实现的
用户3112896
2020/12/29
5060
掌握小技巧,助你Coding更上一层楼~
话说前几天在网上浏览到一大牛写的关于Android布局优化的文章,看后感触很深,回过头看看自己写过的代码,发现还是有不少需要改进,今天找不到那天看的文章了,只能自己总结一些,以后有机会再次补充吧~
贺biubiu
2019/06/11
6250
Android setContentView流程[通俗易懂]
创建View,当 mFactory2 不为空,就用 factory2 来创建view,否则就返回 view为null
全栈程序员站长
2022/09/13
8160
Android材料设计之FloatingActionButton+Snackbar+SheetX3
本文把几个小东西讲一下 FloatingActionButton:浮动按钮 Snackbar:底弹框 BottomSheet:底抽屉 BottomSheetDialog :抽屉对话框 Bot
张风捷特烈
2018/12/19
1K0
Android最常用的控件ListView(详解)
在Android开发中,ListView是一个比较常用的控件。它以列表的形式 展示具体数据内容,并且能够根据数据的长度自适应屏幕显示。
全栈程序员站长
2022/09/15
4.9K0
Android最常用的控件ListView(详解)
让你的EditText删除表情比微信更高效--记一次android性能分析优化实战
自己在做SpEditTool:一个支持表情,@mention,#话题#等功能的EditText控件,这个项目的时候出现了一个很奇怪的问题
Android技术干货分享
2019/08/12
1.5K0
推荐阅读
相关推荐
TextView AutoLink, ClikSpan 与长按事件冲突的解决
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档