Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >王者荣耀「绝悟」完全体上线:解禁全英雄,在线约你来战

王者荣耀「绝悟」完全体上线:解禁全英雄,在线约你来战

作者头像
量子位
发布于 2023-03-10 07:02:56
发布于 2023-03-10 07:02:56
35202
代码可运行
举报
文章被收录于专栏:量子位量子位
运行总次数:2
代码可运行
木易 发自 凹非寺  量子位 报道 | 公众号 QbitAI

腾讯AI Lab与王者荣耀联合研发的策略协作型 AI「绝悟」,全英雄池解禁,升级成「完全体」了。

11月28日到30日,将限时开放三天公众体验。

这次的升级,带来了新算法,除了突破了可用英雄限制,还优化了禁选英雄博弈策略。

而与此次升级相关的研究,也在近期被NeurIPS 2020TNNLS分别收录。

在这两篇研究中,分别介绍了「绝悟」进行强化训练监督训练具体细节。

那么,「完全体绝悟」是如何训练出来的呢?

就让我们顺着这次的论文,好好来了解一下。

新的MOBA AI强化学习范式

这次更新带来的最大亮点便是:全英雄池更新。但是AI来说,英雄数增多,意味着的是阵容组合数量将呈多项式增长。

这对于使用自对弈强化学习进行训练的AI来说,不甚友好,也是必须面对的问题。

在NeurIPS 2020中,腾讯实验室提出了一种基于深度强化学习的学习范式,来尝试解决这个问题。

首先,基于Actor-Learner框架,建立一个分布式的RL架构,并使用离策略(off-policy)的方式产生训练数据。

之后在进行强化学习中,采用了统一的Actor-Critic网络结构来诠释不同英雄的游戏机制以及动作。

另外,研究者还受到神经网络工作中课程学习的启发,在训练设计了一套课程学习方法:先从小任务开始学,然后逐渐增加难度。

具体来讲,就是先用固定阵容来训练多个teacher模型,然后进行蒸馏,把所有teacher的知识蒸馏到一个模型中。

利用了student-driven的策略蒸馏方法,便可以将从简单任务中学习到的知识转移到复杂的任务中。

此外,对于完整的游戏来说,禁选英雄(BanPick,BP)也是其中重要的一环。

常见的BP方法有Minimax算法,不过受限于计算难度,只适用于小英雄池。因此,随着可用英雄数量的增加,便会带来新的问题。

而腾讯实验室给出的方案是:基于蒙特卡洛树搜索(MCTS)和神经网络进行BP的方法。

在最后的测试中,这个AI展现出了惊人的胜率:

在对抗职业选手中,实现了95.2%的胜率(42局);而对抗高水平的玩家中,则实现了97.7%的胜率(642,047局)。

监督学习,让AI达到人类高手水平

另外,便是监督学习了。在今年11月14日起开放的「绝悟」第1到19级,就有多个关卡由监督学习训练而成。

而TNNLS中的论文,便详细介绍了「绝悟」智能体,是如何进行监督学习的。

监督学习成功的关键之一,便是设计好特征标签,对于MOBA游戏,腾讯实验室是这么设计的:

  • 特征中,包括两部分:矢量特征,代表游戏状态;图像特征,代表地图信息。
  • 标签设计也分两部分:意图标签,代表大局观;行动标签,表征微操策略。

大局观对应的多视角意图

研究人员设计了多视角意图标签,包括全局意图和局部意图标签,以对大局观进行建模。

整个地图被划分成24*24的区域块,然后全局意图标签被定义为地图上发生下一系列攻击的编号区域。

局部小地图被划分为12*12的区域块,局部意图标签是从两次攻击事件之间玩家的中途位置提取的,为学习大局观提供了中间信息。

微操策略的层级动作设计

研究人员设计了分层的动作标签,用以控制英雄的微操策略。

这其中包括两层。第一层代表动作类型,比如移动、技能、回城等。第二层代表选定动作的参数,比如方向、位置、目标等。

多模态特征

同时使用了矢量特征和类图像特征,它们分别表征的是游戏状态和地图信息。

其中矢量特征包括血量,技能冷却,金币,等级等及时序信息等。

类图像特征包括局部类图像特征和全局类图像特征。

局部类图像特征的范围是英雄的局部小地图,全局类图像特征的范围是全局地图。

在设计好特征和标签的基础上,AI建模任务便被定义成了一个层级的多分类问题,之后通过神经网络模型来解决。

模型简单来看就是:全局和局部图像特征经过卷积神经网络处理,矢量特征通过全连接网络处理,两者连接到一起去预测全局和局部的宏观意图。

之后进一步的,嵌入大局观的预测结果,和原有的隐层编码连接在一起,经过输出层输出微操策略对应的标签。

此外,在大局观和微操策略间,使用了加权的多任务损失函数进行学习。

而在本研究中的最后测试中,结果也表明:在监督学习后,该AI系统在5V5模式中,能达到人类顶尖业余高手水平。

关于「绝悟」

「绝悟」,是由腾讯AI Lab与王者荣耀联合研发的策略协作型 AI。名字寓意绝佳领悟力。

其技术研发始于2017年12月,并在2018年12月通过了顶尖业余水平测试。

从去年开始,「绝悟」开始被训练使用英雄,今年1月AI可以职业水平的英雄达到20名,而4月达到了40名。

技术团队一年内让 AI 掌握的英雄数从1个增加到100+个,完全解禁英雄池。因此,此版本得名「绝悟完全体」。

不说了,我要打开王者荣耀去会会这个「完全体」了。

本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。

「MEET 2021智能未来大会」启幕,

早鸟票限时抢购中,扫码预定席位!

李开复博士、尹浩院士、清华唐杰教授,以及来自小米美团爱奇艺小冰亚信浪潮、容联、澎思地平线G7等知名AI大厂的大咖嘉宾齐聚,期待关注AI的朋友报名参会、共探新形势下智能产业发展之路。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见~

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-11-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量子位 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
腾讯绝悟AI完全体限时开放体验,研究登上国际顶会与顶刊
感谢阅读腾讯AI Lab微信号第112篇文章。本文将介绍绝悟 AI 完全体升级版本的技术方法,也欢迎读者到王者荣耀 app 亲身体验其技术实力。 腾讯 AI Lab 宣布与王者荣耀联合研发的策略协作型 AI“绝悟”推出升级版本。 创新算法突破了可用英雄限制(英雄池数量从40增为100+),让 AI 完全掌握所有英雄的所有技能,能应对高达10的15次方的英雄组合数变化; 优化了禁选英雄(BanPick,简称BP)博弈策略,能综合自身技能与对手情况等多重因素派出最优英雄组合。 相关研究已被 AI 顶级会议 N
腾讯技术工程官方号
2020/12/01
1.5K0
王者荣耀:在绝悟上进行监督学习
《Supervised learning achieves human-level performance in MOBA games: A case study of honor of kings》
算法一只狗
2022/11/04
1K0
腾讯 AI「绝悟」KPL 击败职业玩家联队,晋升王者荣耀电竞职业水平
「绝悟」是腾讯 AI Lab 与王者荣耀团队共同探索的前沿研究项目,在王者荣耀世界冠军杯半决赛的特设环节中,这一人工智能在职业选手赛区联队带来的 5v5 水平测试中获胜,首次在王者荣耀游戏中击败了现役职业玩家。
机器之心
2019/08/05
2.2K0
腾讯 AI「绝悟」KPL 击败职业玩家联队,晋升王者荣耀电竞职业水平
挑战王者荣耀人工智能绝悟,我和 AI「55 开」
在 AI 破解围棋难题之后,电子竞技类游戏成为测试和检验前沿人工智能的复杂决策、行动、协作与预测能力的重要平台。国外有刀塔 2 AI 项目 OpenAI Five、星际争霸 2 研究 AlphaStar,国内有腾讯 AI Lab 携手王者荣耀展开绝悟 AI 的研究。
机器之心
2020/05/19
7330
挑战王者荣耀人工智能绝悟,我和 AI「55 开」
不服SOLO:腾讯绝悟AI击败王者荣耀顶尖职业玩家,论文入选AAAI,未来将开源
围棋被攻克之后,多人在线战术竞技游戏(MOBA)已经成为测试检验前沿人工智能的动作决策和预测能力的重要平台。基于腾讯天美工作室开发的热门 MOBA 类手游《王者荣耀》,腾讯 AI Lab 正努力探索强化学习技术在复杂环境中的应用潜力。本文即是其中的一项成果,研究用深度强化学习来为智能体预测游戏动作的方法,该论文已被 AAAI-2020 接收。
机器之心
2019/12/25
1.4K0
不服SOLO:腾讯绝悟AI击败王者荣耀顶尖职业玩家,论文入选AAAI,未来将开源
游戏AI探索之旅:从AlphaGo到MOBA游戏
背景:7月28日,腾讯云在北京举办云+社区沙龙,邀请来自腾讯与四川云检科技的五位AI技术专家,分享他们在专业领域的AI开发经验,帮助开发者在具体行业场景中实践AI技术。本文根据王亮在【7.28日腾讯云
腾讯技术工程官方号
2018/08/17
4.7K5
腾讯AI Lab x 王者荣耀:开放让「AI+游戏」想象力落地
8月18日,王者荣耀「无限开放计划交流会」在深圳举办,这是一次「造梦之旅」的开始。 王者荣耀项目执行制作人黄蓝枭宣布启动天工计划,将王者荣耀的游戏玩法核心进一步向外界开放,推动游戏生态再一次进化。该计划将开放游戏中的地图、角色、剧情到关卡的编辑功能,外部工作室和个人自由创造全新玩法,并有机会上架到游戏与玩家见面,是两亿用户对想象力的表达。王者荣耀还会将游戏玩法和直播互动自由结合,如开发弹幕彩蛋和自定义玩法等直播互动新形式(点击这里 查看更多详情)。 腾讯 AI Lab x 王者荣耀 x 高校 携手
腾讯高校合作
2019/08/20
9430
腾讯AI Lab x 王者荣耀:开放让「AI+游戏」想象力落地
Dota之后,《王者荣耀》也被AI攻陷,势把人类顶级玩家拉下马
19日,腾讯AI Lab团队在arXiv上发表文章,训练AI大战人类玩家,而此次所选择的游戏,正是火遍大江南北的手游——《王者荣耀》。
昱良
2018/12/28
6530
王亮:游戏AI探索之旅——从alphago到moba游戏
今天分享的课题是游戏AI探索之旅。本次分享分为四部分,第一部分,什么是游戏AI,游戏AI为什么对现在的游戏非常重要;第二部分,业界和工业界对于做游戏AI主要的方法,以及现在业界一些主流的游戏上的进展。第三部分,结合基于公司自有的MOBA游戏,分享一下我们做的一些探索研究及现在的进展;第四部分,会简单介绍一下基于深度学习方法来做游戏AI,对于游戏开发者来说需要提供哪些环境便于AI的开发。希望通过今天的分享能给大家之后工作或者接下来学习上带来一些的启发和思考。
腾讯云开发者社区技术沙龙
2018/08/20
1.3K0
腾讯AI制霸王者荣耀,世界杯5V5 「绝悟」绝杀职业玩家,1天训练强度超人类440年
昨日,腾讯AI Lab研发的智能体「绝悟」在王者荣耀世界冠军杯半决赛特设环节,与职业选手职业选手赛区联队的5v5对决中获胜!
代码医生工作室
2019/08/06
8180
腾讯AI×王者荣耀「绝悟」项目首亮相:KPL秋季决赛击败顶尖战队
据机器之心了解,这是腾讯 AI Lab 与王者荣耀共同探索的研究项目——策略协作型 AI「绝悟」首次露面,并于昨天在KPL秋季决赛接受前职业 KPL 选手辰鬼、零度和职业解说白乐、九天和立人组成的人类战队(平均水平超过 99% 玩家)的水平测试。最终 AI 战队获得胜利。这是继围棋 AI「绝艺」后,腾讯 AI 在深度学习与强化学习领域的又一项前沿研究。
机器之心
2019/01/02
1.6K0
游戏玩得好的AI,已经在看病救人了
明敏 羿阁 发自 凹非寺 量子位 | 公众号 QbitAI 一个游戏AI,怎么干起医生的活了? 而且这本事还是从打游戏的经验里总结来的。 喏,拿一张病理全片扫描图像,不用遍历所有高倍镜视野,也能找到病灶所在。 在它看来,这个过程和《我的世界》里伐木居然是类似的。 都是三步走: 先观察大环境 锁定小范围 最终确定目标。 而且这种方法效率还贼高,是传统方法的400%。 不愧是拿过NeurIPS MineRL竞赛冠军的游戏AI…… 所以,它到底是怎么做到的? 游戏AI怎么悬壶济世? 在介绍这只游戏AI前,让我
量子位
2023/02/28
2530
游戏玩得好的AI,已经在看病救人了
清华等世界12所顶尖高校学霸组团「打王者」,竟是为了搞科研?
---- 新智元报道   编辑:好困 桃子 【新智元导读】见过学霸打王者的样子吗?这不,清华、中科大、耶鲁等世界12所顶尖高校学霸集结,一来打王者,二来搞科研。 之前凑在一起「打王者」的学霸又来了! 成都大运会开幕在即,「世界大学生数智竞技邀请赛」正式启动。 国际级规模的大赛共邀请了12支队伍(包含中国大陆地区4所高校、中国港澳台地区及海外8所高校)参加。 每支队伍都需要训练三位英雄,并在之后让自己的AI进行「3V3」的对战,而获得冠军的团队可获得高达20万的奖金。 在此前的1V1中,各大高校的AI
新智元
2022/03/21
5070
在《我的世界》当矿工,腾讯「绝悟」夺冠NeurIPS MineRL 挑战赛
近年来,基于强化学习的计算工具在包括图像分类和机器人对象操作在内的众多任务中取得了显著成果。与此同时,计算机科学家也一直在训练强化学习模型来玩特定的人类游戏和电子游戏。
机器之心
2021/12/13
6650
在《我的世界》当矿工,腾讯「绝悟」夺冠NeurIPS MineRL 挑战赛
腾讯AI Lab绝悟团队夺冠Kaggle足球AI竞赛
Google Research 与英超曼城俱乐部在 Kaggle 平台上联合举办的 11v11 足球 AI 竞赛 Google Football 近日宣布最终结果:腾讯 AI Lab 绝悟 WeKick 版本(下称绝悟)以 1785.8 的分数获得冠军,且相比于其它队伍优势非常明显。
CV君
2021/01/05
1.1K0
腾讯AI Lab绝悟团队夺冠Kaggle足球AI竞赛
王者荣耀AI绝悟如何选英雄?腾讯AI Lab新研究揭秘
腾讯 AI Lab 开发的 AI 智能体「绝悟」已让王者峡谷不再只是人类召唤师的竞技场,而且这个 AI 战队在上月底进化成了「完全体」。在一局完整的比赛中,英雄选择阶段是至关重要的(比如五射手或五法师阵容会有官方劝退)。
磐创AI
2021/01/12
8610
王者荣耀AI绝悟如何选英雄?腾讯AI Lab新研究揭秘
王者荣耀的B面:人类在此喧闹,AI却在他们脚下悟道
浅友们好~我是史中,我的日常生活是开撩五湖四海的科技大牛,我会尝试各种姿势,把他们的无边脑洞和温情故事讲给你听。如果你想和我做朋友,不妨加微信(shizhongmax)。
浅黑科技
2022/11/11
1K0
王者荣耀的B面:人类在此喧闹,AI却在他们脚下悟道
腾讯绝悟AI转行踢足球,还在曼城的Kaggle竞赛中夺冠了
机器之心报道 作者:泽南 绝悟:我跟瓜迪奥拉执教的曼彻斯特城「进行了一番交流」。 从打王者荣耀到踢足球,腾讯 AI Lab 的绝悟最近有了又一次进化。 12 月 30 日,首届谷歌足球 Kaggle 竞赛正式结束,来自腾讯 AI Lab 的绝悟 WeKick 版本,凭借 1785.8 的总分在与全球顶级技术团队的竞技中以显著优势获得了冠军。 这是自今年 11 月底,腾讯 AI Lab 与王者荣耀联合研发的策略协作型 AI 绝悟升级为完全体之后,腾讯 AI 的又一次新尝试。 在 11 月 28-30 日手游
机器之心
2023/03/29
5890
腾讯绝悟AI转行踢足球,还在曼城的Kaggle竞赛中夺冠了
腾讯AI击败王者荣耀职业队,全靠自学、策略清奇,一天训练量为人类440年
一场激烈的对战正在进行,左侧是五位人类职业电竞高手组成的赛区联队,另一方是……嗯?他们的对手没有出场?五个座椅空空荡荡?
量子位
2019/08/05
5930
腾讯AI击败王者荣耀职业队,全靠自学、策略清奇,一天训练量为人类440年
7 Papers | 腾讯王者荣耀绝悟AI;ICLR高分论文Reformer
论文 1:Mastering Complex Control in MOBA Games with Deep Reinforcement Learning
机器之心
2019/12/31
2.6K0
7 Papers | 腾讯王者荣耀绝悟AI;ICLR高分论文Reformer
推荐阅读
腾讯绝悟AI完全体限时开放体验,研究登上国际顶会与顶刊
1.5K0
王者荣耀:在绝悟上进行监督学习
1K0
腾讯 AI「绝悟」KPL 击败职业玩家联队,晋升王者荣耀电竞职业水平
2.2K0
挑战王者荣耀人工智能绝悟,我和 AI「55 开」
7330
不服SOLO:腾讯绝悟AI击败王者荣耀顶尖职业玩家,论文入选AAAI,未来将开源
1.4K0
游戏AI探索之旅:从AlphaGo到MOBA游戏
4.7K5
腾讯AI Lab x 王者荣耀:开放让「AI+游戏」想象力落地
9430
Dota之后,《王者荣耀》也被AI攻陷,势把人类顶级玩家拉下马
6530
王亮:游戏AI探索之旅——从alphago到moba游戏
1.3K0
腾讯AI制霸王者荣耀,世界杯5V5 「绝悟」绝杀职业玩家,1天训练强度超人类440年
8180
腾讯AI×王者荣耀「绝悟」项目首亮相:KPL秋季决赛击败顶尖战队
1.6K0
游戏玩得好的AI,已经在看病救人了
2530
清华等世界12所顶尖高校学霸组团「打王者」,竟是为了搞科研?
5070
在《我的世界》当矿工,腾讯「绝悟」夺冠NeurIPS MineRL 挑战赛
6650
腾讯AI Lab绝悟团队夺冠Kaggle足球AI竞赛
1.1K0
王者荣耀AI绝悟如何选英雄?腾讯AI Lab新研究揭秘
8610
王者荣耀的B面:人类在此喧闹,AI却在他们脚下悟道
1K0
腾讯绝悟AI转行踢足球,还在曼城的Kaggle竞赛中夺冠了
5890
腾讯AI击败王者荣耀职业队,全靠自学、策略清奇,一天训练量为人类440年
5930
7 Papers | 腾讯王者荣耀绝悟AI;ICLR高分论文Reformer
2.6K0
相关推荐
腾讯绝悟AI完全体限时开放体验,研究登上国际顶会与顶刊
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验