Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >MOBA游戏中的宏观策略建模实践【王者荣耀】

MOBA游戏中的宏观策略建模实践【王者荣耀】

作者头像
用户7623498
发布于 2020-08-04 03:31:46
发布于 2020-08-04 03:31:46
8540
举报

1.内容提要

游戏AI的下一个挑战主要在实时策略游戏领域(RTS,Real Time Strategy)。RTS提供了部分可观测的游戏环境,智能体之间在一非常大的行动空间中互动,这个空间比围棋的大很多。掌握RTS游戏需要同时具有强大的宏观策略和微观操作。

最近,在微观操作方面已经有了很大的进展,但在宏观策略方面仍然欠缺。这篇文章中,我们提出了一种新颖的基于学习的分层宏观策略模型进行多人在线竞技游戏(MOBA,Multiplayer Online Battle Arena),这种游戏属于RTS的一个分支。

通过分层宏观策略模型的训练后,智能体可以准确地进行宏观策略决策,进而指导微观操作。尤其是每个智能体在与盟友通信的同时进行独立决策的,通信是通过一种新颖的模拟跨智能体交流机制。我们将这个方法在一款流行的5V5MOBA游戏中进行了综合评估。我们的5-AI队伍在与人类排名前1%的队伍的对抗中,获得了48%的胜率。

2.研究思路

Game AI的发展兴起源于AlphaGo,不再赘述整个过程,有兴趣的同学看原文即可。

重点说说RTS相比于围棋的新挑战:

1)计算复杂度,RTS的行动空间或状态空间为10^20000,而围棋是10^250左右。 2)多智能体,RTS需要多智能体协同。 3)不完备信息,RTS中存在战争迷雾,具有更强的不确定性。 4)稀疏和延迟的奖励,RTS的行动周期可以达到20000帧,而围棋通常不超过361步。

目前RTS方向的研究取得了一定进展,但仍然有以下几个问题没有很好的解决:

1)通过微操级别的状态空间学习宏观策略非常困难。 2)目前宏观策略的学习主要依赖于手写公式的方式,通过influence maps/potential fields的计算和融合。在MOBA中由于参数众多,很难手工设计。 3)多智能体协同是RTS中宏观策略实现的最大挑战之一。 4)我们发现宏观策略建模是MOBA中AI性能的关键影响因素,但前人的工作中没有考虑这一点。

本文所提出的技术路线:

提出了一种分层宏观策略模型(HMS,Hierarchical Macro Strategy),一种用于MOBA的通用有监督框架,可以有效应对计算复杂度和多智能体的挑战。该方法通过在游戏阶段建模的指导下,预测游戏地图中的attention来进行宏观策略操作。因此,HMS通过融合游戏的知识来降低计算复杂度。而且,每个HMS智能体通过一种新的队友交流机制进行学习,应对多智能体挑战。

3.试验评估情况

1)数据准备:30万组游戏记录用于训练,从中整理了2.5亿个案例用于训练。考虑了视觉和属性两类特征,视觉选取了85个特征,如位置等,并把视觉特征模糊成12*12的分辨率。属性特征考虑了181个特征如英雄ID等。

2)模型程序:模型细节不多解释了参见原文。主要是用卷积和全连接层做视觉特征提取,用全连接层做属性特征提取,先做Task1的游戏阶段建模,然后是task2的注意力,最终输出宏观策略,再指导微观操作。整个训练过程在8个GPU的情况下,需要大概12小时。其中task1和task2的建模输出如视觉观察的情况是一致的,task1的输出如图4a所示。

3)关于游戏开局策略、不同英雄的宏观策略、智能体之间的模拟交流机制都得到了很好的验证。主要通过完整版的HMS分别与没有宏观策略、没有交流机制、没有游戏阶段建模的AI进行对战,结果明显是完整版的HMS优于其他AI,见下表,每一列中左侧是HMS的胜率,右侧是测试AI或人类选手的胜率。其中人类选手是从所有选手中选取了前1%的250名选手进行对战,胜率达到48.3%。

4.HMS模型基本原理

HMS模型主要由注意力部分、游戏阶段建模部分、模拟跨智能体交流部分组成,主要组件包括卷积层、全连接层、contact层等,然后将宏观策略输出给微观操作模型进行微操。详细参见原文。

5.未来展望

本文提出的HMS方法在RTS中表现出了非常好的潜力,可以推广到其他MOBA游戏中,比如星际争霸等。跨智能体的模拟交流机制同样可以用于智能体协同。关于游戏阶段的建模需要针对不同游戏进行特定设计,但是底层的思想是可以推广的。

HMS同样可以在多智能体协同的场景中进行推广,比如机器人足球等。

在未来,我们将会把规划机制融合到HMS中,利用AlphaGo中的MCTS(蒙特卡洛搜索)来对RTS的行动进行规划,我们期待规划机制对RTS游戏发挥很好的作用,因为这不仅对不完备信息游戏有用,而且可以在有监督学习失效时给出期望的奖励反馈。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-01-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 决策智能与机器学习 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
腾讯AI×王者荣耀「绝悟」项目首亮相:KPL秋季决赛击败顶尖战队
据机器之心了解,这是腾讯 AI Lab 与王者荣耀共同探索的研究项目——策略协作型 AI「绝悟」首次露面,并于昨天在KPL秋季决赛接受前职业 KPL 选手辰鬼、零度和职业解说白乐、九天和立人组成的人类战队(平均水平超过 99% 玩家)的水平测试。最终 AI 战队获得胜利。这是继围棋 AI「绝艺」后,腾讯 AI 在深度学习与强化学习领域的又一项前沿研究。
机器之心
2019/01/02
1.6K0
Dota之后,《王者荣耀》也被AI攻陷,势把人类顶级玩家拉下马
19日,腾讯AI Lab团队在arXiv上发表文章,训练AI大战人类玩家,而此次所选择的游戏,正是火遍大江南北的手游——《王者荣耀》。
昱良
2018/12/28
6370
让AI学会打王者,有什么用?
作为目前全球最负盛名的人工智能盛会之一,NeurIPS在每年年末都是计算机科学领域瞩目的焦点。被NeurIPS接收的论文,代表着当今神经科学和人工智能研究的最高水平,也反映着行业趋势的变化。
新智元
2023/01/08
4790
让AI学会打王者,有什么用?
王亮:游戏AI探索之旅——从alphago到moba游戏
今天分享的课题是游戏AI探索之旅。本次分享分为四部分,第一部分,什么是游戏AI,游戏AI为什么对现在的游戏非常重要;第二部分,业界和工业界对于做游戏AI主要的方法,以及现在业界一些主流的游戏上的进展。第三部分,结合基于公司自有的MOBA游戏,分享一下我们做的一些探索研究及现在的进展;第四部分,会简单介绍一下基于深度学习方法来做游戏AI,对于游戏开发者来说需要提供哪些环境便于AI的开发。希望通过今天的分享能给大家之后工作或者接下来学习上带来一些的启发和思考。
腾讯云开发者社区技术沙龙
2018/08/20
1.3K0
NeurIPS 2023 Spotlight | 腾讯AI Lab绝悟新突破:在星际2灵活策略应对职业选手
实时策略游戏(RTS)以其复杂的游戏环境更贴近现实世界,一直是 AI 研究的焦点和挑战所在。《星际争霸 2》作为其中极具代表性的游戏,因其对资源收集、战术规划和对手分析的高实时要求,已成为业内广泛用于训练和验证 AI 决策能力的理想平台。早在 2018 年,腾讯 AI Lab 研发的 AI 就已击败游戏内最高难度的 AI。
机器之心
2023/12/20
3590
NeurIPS 2023 Spotlight | 腾讯AI Lab绝悟新突破:在星际2灵活策略应对职业选手
不服SOLO:腾讯绝悟AI击败王者荣耀顶尖职业玩家,论文入选AAAI,未来将开源
围棋被攻克之后,多人在线战术竞技游戏(MOBA)已经成为测试检验前沿人工智能的动作决策和预测能力的重要平台。基于腾讯天美工作室开发的热门 MOBA 类手游《王者荣耀》,腾讯 AI Lab 正努力探索强化学习技术在复杂环境中的应用潜力。本文即是其中的一项成果,研究用深度强化学习来为智能体预测游戏动作的方法,该论文已被 AAAI-2020 接收。
机器之心
2019/12/25
1.4K0
不服SOLO:腾讯绝悟AI击败王者荣耀顶尖职业玩家,论文入选AAAI,未来将开源
学界 | 阿里人工智能新研究:在星际争霸中实现多兵种协同作战
选自arXiv 作者:Peng Peng等 机器之心编译 参与:李泽南 在围棋和德州扑克后,RTS 游戏《星际争霸》已经成为人工智能研究者们征服的下一个目标。近日,来自阿里巴巴和伦敦大学学院(UCL)的研究者们发表了一项新研究,他们宣称人工智能控制的多个游戏单位在无监督学习的情况下已经可以发展出类似于人类玩家的战术。这种协同多个人工智能体新方法或许可以为研究者们带来启示,点击阅读原文可下载该论文。 过去十年里,人工智能技术有了突飞猛进的发展。在有监督学习的情况下,机器已经可以展现达到甚至超越人类认知水平的图
机器之心
2018/05/07
1.2K0
学界 | 阿里人工智能新研究:在星际争霸中实现多兵种协同作战
中科大吴锋:多智能体的分布式在线决策 | 腾讯AI Lab学术论坛演讲
本文转载自:腾讯AI实验室 本文第一部分是中国科学技术大学计算机科学与技术学院副教授吴锋带来的主题演讲,第二部分介绍了腾讯AI Lab在AI研究到应用的布局中,在「AI+游戏」方向的挑战与应对的分析。 3月15日,腾讯AI Lab第二届学术论坛在深圳举行,聚焦人工智能在医疗、游戏、多媒体内容、人机交互等四大领域的跨界研究与应用。全球30位顶级AI专家出席,对多项前沿研究成果进行了深入探讨与交流。腾讯AI Lab还宣布了2018三大核心战略,以及同顶级研究与出版机构自然科研的战略合作(点击 这里 查看详情)。
腾讯高校合作
2018/06/04
1.9K0
王者荣耀AI绝悟如何选英雄?腾讯AI Lab新研究揭秘
腾讯 AI Lab 开发的 AI 智能体「绝悟」已让王者峡谷不再只是人类召唤师的竞技场,而且这个 AI 战队在上月底进化成了「完全体」。在一局完整的比赛中,英雄选择阶段是至关重要的(比如五射手或五法师阵容会有官方劝退)。
磐创AI
2021/01/12
8360
王者荣耀AI绝悟如何选英雄?腾讯AI Lab新研究揭秘
你已经是台成熟的vivo手机了,要自己学会打王者
刚刚,他们披露了AI研究方面的最新进展,和此前的潮头公司一样,vivo也把目光投向游戏领域,而且一出手就是《王者荣耀》。
量子位
2019/04/24
6720
你已经是台成熟的vivo手机了,要自己学会打王者
1-10落败,5分钟崩盘!星际2职业高手史上首次被AI击溃,AlphaStar一战成名
DeepMind开发的全新AI程序AlphaStar,在今天凌晨的《星际争霸2》人机大战直播节目中,轻松战胜2018 WCS Circuit排名13、神族最强10人之一的MaNa。
量子位
2019/04/24
4930
1-10落败,5分钟崩盘!星际2职业高手史上首次被AI击溃,AlphaStar一战成名
腾讯王者荣耀AI论文首次曝光:五AI王者局开黑与人类战队打成平手
腾讯刚刚发布的一篇论文显示,王者荣耀AI在不声不响间,又掌握了新的技能:组团开黑。而且战绩不俗。
量子位
2018/12/28
9200
王者荣耀:在绝悟上进行监督学习
《Supervised learning achieves human-level performance in MOBA games: A case study of honor of kings》
算法一只狗
2022/11/04
9970
腾讯AI击败王者荣耀职业队,全靠自学、策略清奇,一天训练量为人类440年
一场激烈的对战正在进行,左侧是五位人类职业电竞高手组成的赛区联队,另一方是……嗯?他们的对手没有出场?五个座椅空空荡荡?
量子位
2019/08/05
5900
腾讯AI击败王者荣耀职业队,全靠自学、策略清奇,一天训练量为人类440年
游戏AI探索之旅:从AlphaGo到MOBA游戏
背景:7月28日,腾讯云在北京举办云+社区沙龙,邀请来自腾讯与四川云检科技的五位AI技术专家,分享他们在专业领域的AI开发经验,帮助开发者在具体行业场景中实践AI技术。本文根据王亮在【7.28日腾讯云
腾讯技术工程官方号
2018/08/17
4.7K5
王者荣耀「绝悟」完全体上线:解禁全英雄,在线约你来战
木易 发自 凹非寺  量子位 报道 | 公众号 QbitAI 腾讯AI Lab与王者荣耀联合研发的策略协作型 AI「绝悟」,全英雄池解禁,升级成「完全体」了。 11月28日到30日,将限时开放三天公众体验。 这次的升级,带来了新算法,除了突破了可用英雄限制,还优化了禁选英雄博弈策略。 而与此次升级相关的研究,也在近期被NeurIPS 2020和TNNLS分别收录。 在这两篇研究中,分别介绍了「绝悟」进行强化训练和监督训练具体细节。 那么,「完全体绝悟」是如何训练出来的呢? 就让我们顺着这次的论文,好好来了
量子位
2023/03/10
3420
王者荣耀「绝悟」完全体上线:解禁全英雄,在线约你来战
20+顶尖高校同时开打《王者荣耀》!实际上是一场科研battle,你能信?
金磊 假装发自 王者峡谷 量子位 报道 | 公众号 QbitAI 不是吧,不是吧。 一群学霸聚集在一起,竟然是为了打《王者荣耀》?! 而且还是来自清北、中科院、浙大等20余所顶级学府的那种。 但毕竟是一帮学霸们的“聚会”,果然连打游戏的“姿势”都那么与众不同: 他们竟然要用《王者荣耀》搞科研! (妥妥的是有种诸葛亮“黄金分割率”的味道了。) 这到底是怎么一回事? 在《王者荣耀》里搞科研 要想搞清楚这件事,就需要先来颠覆一下你对《王者荣耀》的认知。 友友们,其实它不单单是一款游戏那么简单: 还是一个极
量子位
2023/03/01
3630
20+顶尖高校同时开打《王者荣耀》!实际上是一场科研battle,你能信?
学界 | 中科院开源星际争霸2宏观运营研究数据集MSC
选自arXiv 机器之心编译 参与:李泽南、蒋思源 DeepMind 与暴雪共同发起的星际争霸 2 人工智能研究看起来遭遇了很大挑战。目前的人工智能还难以在完整对战中击败简单级别的游戏内建电脑玩家。不过,两家公司 8 月份共同推出的人工智能研究环境 SC2LE 为后续研究提供了可利用的平台。中国科学院自动化研究所的研究人员最近针对宏观运营任务提出了全新数据集 MSC,试图推动研究社区继续前进。值得一提的是,中科院自动化所的团队 10 月 8 日刚刚在星际争霸 AI 竞赛 AIIDE 2017 上取得第四名
机器之心
2018/05/08
8050
学界 | 中科院开源星际争霸2宏观运营研究数据集MSC
腾讯提出共享 AI,抢先布局游戏与多媒体 AI,首秀同声传译
腾讯AI实验室
2017/11/09
3K2
腾讯提出共享 AI,抢先布局游戏与多媒体 AI,首秀同声传译
腾讯 AI「绝悟」KPL 击败职业玩家联队,晋升王者荣耀电竞职业水平
「绝悟」是腾讯 AI Lab 与王者荣耀团队共同探索的前沿研究项目,在王者荣耀世界冠军杯半决赛的特设环节中,这一人工智能在职业选手赛区联队带来的 5v5 水平测试中获胜,首次在王者荣耀游戏中击败了现役职业玩家。
机器之心
2019/08/05
2.1K0
腾讯 AI「绝悟」KPL 击败职业玩家联队,晋升王者荣耀电竞职业水平
推荐阅读
腾讯AI×王者荣耀「绝悟」项目首亮相:KPL秋季决赛击败顶尖战队
1.6K0
Dota之后,《王者荣耀》也被AI攻陷,势把人类顶级玩家拉下马
6370
让AI学会打王者,有什么用?
4790
王亮:游戏AI探索之旅——从alphago到moba游戏
1.3K0
NeurIPS 2023 Spotlight | 腾讯AI Lab绝悟新突破:在星际2灵活策略应对职业选手
3590
不服SOLO:腾讯绝悟AI击败王者荣耀顶尖职业玩家,论文入选AAAI,未来将开源
1.4K0
学界 | 阿里人工智能新研究:在星际争霸中实现多兵种协同作战
1.2K0
中科大吴锋:多智能体的分布式在线决策 | 腾讯AI Lab学术论坛演讲
1.9K0
王者荣耀AI绝悟如何选英雄?腾讯AI Lab新研究揭秘
8360
你已经是台成熟的vivo手机了,要自己学会打王者
6720
1-10落败,5分钟崩盘!星际2职业高手史上首次被AI击溃,AlphaStar一战成名
4930
腾讯王者荣耀AI论文首次曝光:五AI王者局开黑与人类战队打成平手
9200
王者荣耀:在绝悟上进行监督学习
9970
腾讯AI击败王者荣耀职业队,全靠自学、策略清奇,一天训练量为人类440年
5900
游戏AI探索之旅:从AlphaGo到MOBA游戏
4.7K5
王者荣耀「绝悟」完全体上线:解禁全英雄,在线约你来战
3420
20+顶尖高校同时开打《王者荣耀》!实际上是一场科研battle,你能信?
3630
学界 | 中科院开源星际争霸2宏观运营研究数据集MSC
8050
腾讯提出共享 AI,抢先布局游戏与多媒体 AI,首秀同声传译
3K2
腾讯 AI「绝悟」KPL 击败职业玩家联队,晋升王者荣耀电竞职业水平
2.1K0
相关推荐
腾讯AI×王者荣耀「绝悟」项目首亮相:KPL秋季决赛击败顶尖战队
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档