Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >OpenAI Dota2 5v5模式击败人类,AI每天训练量抵人类180年

OpenAI Dota2 5v5模式击败人类,AI每天训练量抵人类180年

作者头像
大数据文摘
发布于 2018-07-31 03:39:07
发布于 2018-07-31 03:39:07
7920
举报
文章被收录于专栏:大数据文摘大数据文摘
大数据文摘编辑组出品

今天凌晨,OpenAI通过官方博客宣布了其在Dota对抗上的新进展——由五个神经网络组成的团战AI团队,在5v5中击败了业余人类玩家,并表示,将有望挑战顶级专业团队。

打Dota乍一听可能没什么了不起的,但这可以被视作AlphaGo的延续:构建可以在看似简单的游戏中击败人类的机器。

OpenAI干了这么一件事:组织了5个神经网络构成团队,在5v5游戏中击败了Dota 2的人类业余选手。他们的目标是在8月份击败国际顶级专业团队(仅限一组英雄的条件下)。

OpenAI也给了这个能力x5的AI一个简单易懂的名字——OpenAI Five!

戳这里看5v5比赛视频?

OpenAI是Elon Musk联合创立的非盈利AI研究机构,旨在提高人们对AI技术现在所处的位置的认识,以及促进科技的安全进步。这不是OpenAI首次公开试玩Dota 2,去年,OpenAI在Dota2 1v1比赛中战胜了人类选手Dendi。

OpenAI Five的训练量级非常大,每天都会玩相当于180年时长的游戏,通过自我对决来学习。它使用在256个GPU和128,000个CPU内核上运行的扩展版近端策略优化进行训练,这是OpenAI去年发布的1v1 Dota AI的更大规模版本。对每个英雄使用单独的LSTM并且不使用人类数据,由此学习可识别的策略。

从Deep Blue到AlphaGo,再到现在的Dota2,将人工智能与人类之间进行较量,一直是计算机科学领域的有趣传统。

与围棋和国际象棋等回合制的游戏模式不同,Dota2更需要大量的实时决策以及队友之间的默契合作。还记得AlphaGo与柯洁那场围棋之战么,人工智能在运筹帷幄的时候总有几分钟的思考时间。但是如果你在Dota2中静止深思,那么你可能会被对手gank。OpenAI表示,游戏的平均运行时间为每秒30帧,也就是说,在平均45分钟的游戏中会产生大约80000帧,而AI大约分析了其中的四分之一。

OpenAI技术细节

问题描述

在星际争霸或者Dota这样复杂的视频游戏中超越人类的能力,是人工智能发展的里程碑。相对于之前的AI在国际象棋或围棋上的里程碑式进步,复杂的视频游戏更能够效仿现实世界的混乱和连续性。具有很高的通用性,在游戏之外也有可用之处。

Dota 2是一款实时战略游戏,有两支队伍,每队5个玩家,每个玩家控制一个称为“英雄”的角色。玩Dota的AI必须掌握以下几点:

1.长时间。Dota游戏以每秒30帧的速度运行,平均时间为45分钟,每场游戏产生80,000帧。大多数行为(例如命令英雄移动到某个位置)单独产生较小的影响,但回城等一些个别行为可能会在战略上影响游戏。一些策略可能贯穿游戏全程。OpenAI Five每四帧观察一次,产生20,000次移动。国际象棋通常在40次移动之前结束,围棋在150次移动之前结束,几乎每一次移动都是战略性的。

2.不完整信息。单位和建筑物只能看到他们周围的区域。地图的其他部分隐藏在雾中,隐藏了敌人和他们的战略。AI需要根据不完整的数据进行推断,并且需要对对手行为建模。象棋和围棋都是全信息游戏。

3.动作高度连续。在Dota中,每个英雄可以采取数十个动作,许多动作都是针对另一个单位或地面上的某个位置。OpenAI将每个英雄的空间分割成170,000个可能的行动(不是在每个帧都有效,比如冷却动作);不计算连续部分,每帧平均有大约1000次有效操作。国际象棋中的平均动作数为35,围棋中是250。

4.高维度、连续的观察空间。Dota包含十个英雄,数十个建筑物,几十个NPC单位以及诸如符文、树木等一大堆游戏特征,和大型连续的地图。AI通过Bot API观察游戏,被允许观察2万个数值(人类所被允许观察的所有值)。国际象棋棋盘有大约70个枚举值(一个8x8的棋盘,6种棋子类型和少量历史信息),一个围棋棋盘有约400个枚举值(一个19x19的棋盘,两种棋子类型加上“劫”)。

此外,Dota规则也非常复杂。游戏开发已经持续了十多年,游戏逻辑在数十万行代码中实现。这个逻辑需要几毫秒的时间才能执行,而国际象棋或围棋引擎则需要几纳秒。游戏也每两周更新一次,不断改变环境语义。

方法

OpenAI系统使用大规模版本的Proximal Policy Optimization进行学习。 OpenAI Five和我们早期的1v1机器人都完全从自我对抗中学习。他们从随机参数开始,不使用来自人类玩家的回放视频进行搜索或引导。

强化学习研究者通常认为,对于长时空上的建模,需要全新的算法,比如分层强化学习。但是OpenAI的结果表明,只要采取合理的方式,目前的算法在大规模资源上运行的结果还不错。

AI经过训练可以通过指数衰减因子γ进行加权,从而最大化指数衰减的未来奖励总和。在最新的OpenAI Five训练中,衰减因子γ从0.998(评估未来奖励的半衰期为46秒)增大到0.9997(评估未来奖励的半衰期为五分钟)。对比而言,PPO这篇论文上最长的推理时间是0.5秒,Rainbow论文上最长的推理时间是4.4秒,Observe and Look Further这篇论文使用的半衰期为46秒。

PPO论文:

https://arxiv.org/abs/1707.06347

Rainbow论文:

https://arxiv.org/abs/1710.02298

Observe and Look Further论文:

https://arxiv.org/abs/1805.11593

进入公众号后台回复“Dota”获取论文~

尽管当前版本的OpenAI Five在最后一击时表现不佳,但是专业Dota评论员Blitz认为OpenAIFive的表现可以比得上一般的人类玩家。

原因是,OpenFive在游戏中对收益的取舍和顶尖的战略决策类似。例如,短期内“补兵”可以获得金钱,而准备团战推塔可能花费更多的时间。如果选择团战,就会丧失小兵收益,然而在胜利以摧毁防御塔为前提的游戏中,放弃团战可能不是明智的选择。所以,AI是朝着长期目标进行优化的。

OpenAI仍需要一些限制条件,比如,和AI比赛的人类对手必须遵守某些规则,包括不使用某些物品和策略。

OpenAI将在下个月举办一场Dota 2巡回赛,展示自己在与顶级玩家竞争时的实力。

当然,也没必要过度担心,因为这个AI虽然可以打Dota,但也只能做这一件事。

相关报道:

https://blog.openai.com/openai-five/

https://techcrunch.com/2018/06/25/openais-dota-2-neural-nets-are-defeating-human-opponents/

今日机器学习概念】

Have a Great Definitio

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-06-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据文摘 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
【攻克Dota2】OpenAI自学习多智能体5v5团队战击败人类玩家
【新智元导读】刚刚,OpenAI 宣布了一个大新闻——他们的一个由5个神经网络组成的OpenAI Five,已经开始击败Dota 2的业余玩家队伍。
新智元
2018/07/31
4990
【攻克Dota2】OpenAI自学习多智能体5v5团队战击败人类玩家
一文解析OpenAI Five,一个会打团战的Dota2 AI
去年,OpenAI的强化学习bot在中路solo中击败职业选手Dendi,赢得众人瞩目,但Dota2是一个5人游戏,在那之后,我们目标是制作一个由神经网络构成的5人团队,它能在8月份举办的Ti8国际邀请赛上,用有限的英雄击败职业队。时至今日,我们有了OpenAI Five,它已经可以在比赛中击败业余玩家。
崔庆才
2019/09/04
3.1K0
一文解析OpenAI Five,一个会打团战的Dota2 AI
热点 | Dota 2被攻陷!OpenAI 人工智能5V5模式击败人类玩家(4000分水平)
2017 年,OpenAI 在 Dota2 TI 决赛现场以 1 对 1 solo 的方式击败了「Dota 2」世界顶级玩家。经过一年的发展,OpenAI 于昨日宣布他们的 AI bot 在 5 v 5 团队赛中击败业余人类玩家,并计划之后能够击败顶级专业团队。
灯塔大数据
2018/07/25
4860
热点 | Dota 2被攻陷!OpenAI 人工智能5V5模式击败人类玩家(4000分水平)
OpenAI:人工智能程序在Dota2的5V5比赛在中击败人类玩家
国外人工智能团队OpenAI在一篇博客文章中透露,为Dota 2设计的最新版本AI击败了五支业余选手团队,其中包括一个由Valve员工组成的团队。上一代 OpenAI的系统被限制为1对1的比赛,并不太复杂。
AiTechYun
2018/07/27
8190
OpenAI:人工智能程序在Dota2的5V5比赛在中击败人类玩家
击败DotA2顶级人类玩家,并不是AI的一次突破
作者:Denny Britz,前谷歌大脑团队成员 问耕 编译整理 量子位 出品 | 公众号 QbitAI △ 工作人员手里举着一个U盘,装在里面的就是击败了人类DotA 2顶级玩家的人工智能程序 当我
量子位
2018/03/27
6790
击败DotA2顶级人类玩家,并不是AI的一次突破
虽又击败了人类选手,但我们认为 OpenAI 的 5v5 DOTA AI 不过如此
AI 科技评论按:各位读者想必今天一睁眼就被「OpenAI 的人工智能在 DOTA 5v5 比赛中也打败了人类选手」的新闻刷屏了。OpenAI 开发的 DOTA AI 去年在 1v1 solo 中打败顶级职业选手 Dendi 和 Sumail 之后,紧接着就放出豪言还要在 5v5 的 DOTA 比赛中击败人类,这一天仿佛这么快就到来了。
AI科技评论
2018/07/27
3620
虽又击败了人类选手,但我们认为 OpenAI 的 5v5 DOTA AI 不过如此
【中国战队包揽234却无缘冠军】OpenAI 的 Dota2 机器人强在哪?
【新智元导读】DOTA2 经典赛事TI7国际邀请赛决出最后冠军,中国团队虽占据234名但无缘冠军。回顾本届比赛,Open AI 的机器人因为战胜了人类玩家而大放异彩,团队也在Twitter上宣布欢迎更多玩家挑战和试用自己的技术。本文带来深度解读,战胜了人类玩家的Open AI 机器人究竟强在哪里?与围棋比赛中的AlphaGo相比是强还是弱?未来在虚拟游戏中,人类是否对机器毫无胜算? Dota2 TI7决赛,中国战队惜败无缘冠军,包揽2、3、4名 8月13日,DOTA2 经典赛事TI7国际邀请赛在美国西雅图钥
新智元
2018/03/22
1.2K0
【中国战队包揽234却无缘冠军】OpenAI 的 Dota2 机器人强在哪?
【攻陷Dota2】马斯克的OpenAI自学习机器人完虐人类最强玩家
【新智元导读】OpenAI 的 机器人刚刚在 Dota2 1v1 比赛中战胜了人类顶级职业玩家 Denti。以建设安全的通用人工智能为己任的 OpenAI,通过“Self-Play”的方式,从零开始训
新智元
2018/03/22
7760
【攻陷Dota2】马斯克的OpenAI自学习机器人完虐人类最强玩家
OpenAI人工智能1v1击败Dota2最强玩家:明年开启5v5模式
机器之心报道 参与:路雪、李亚洲、黄小天 计算机已经在国际象棋和围棋等经典游戏中打败世界上最厉害的人类。现在又有一台计算机在 Valve 举办的 Dota2 国际锦标赛现场打败了「Dota 2」世界顶级玩家,该赛事奖金高达 2400 万美元。 在 Dota2 一对一表演赛中,由 OpenAI 设计的 bot 打败了 Danylo "Dendi" Ishutin,一名在职业生涯中已经赢得 735,449.40 美元奖金的职业玩家。OpenAI 的 bot 在第一场比赛开始约 10 分钟打败了 Dendi。在第
机器之心
2018/05/08
7440
OpenAI人工智能1v1击败Dota2最强玩家:明年开启5v5模式
Dota2团战AI击败人类最全解析:能团又能gank,AI一日人间180年
夏乙 问耕 发自 凹非寺 量子位 出品 | 公众号 QbitAI GG。 随着人类喊出这两个字母,一切都结束了。 OpenAI研发的人工智能战队,首次在5v5的Dota2开黑团战对战中,击败人类玩家战
量子位
2018/07/20
3670
又输了,OpenAI Five完胜Dota 2半职业战队
今日凌晨,OpenAI Five与Dota 2人类职业玩家的对战以AI的胜利告终,Dota 2再一次被攻陷。
大数据文摘
2018/08/08
7230
又输了,OpenAI Five完胜Dota 2半职业战队
OpenAI人工智能1v1击败Dota2最强玩家:明年开启5v5模式
在 Dota2 一对一表演赛中,由 OpenAI 设计的 bot 打败了 Danylo "Dendi" Ishutin,一名在职业生涯中已经赢得 735,449.40 美元奖金的职业玩家。OpenAI 的 bot 在第一场比赛开始约 10 分钟打败了 Dendi。在第二场比赛中 Dendi 放弃,并拒绝进行第三场比赛。
IT阅读排行榜
2018/08/16
4210
DOTA2获胜的AI比AlphaGo厉害?还是媒体和马斯克在联合炒作?
大数据文摘作品,转载要求见文末 编译 | 姜范波 Aileen 这个周末的科技圈再次被“AI恐惧”刷屏,这次打败人类的AI来自Elon Musk的OpenAI。昨天凌晨的DOTA2人机大战中,顶级人类玩家Danylo "Dendi" Ishutin被AI完败。 到底这次人机大战意义何在?这次在一对一DOTA2中打败Dendi到底比AlphaGo更难还是更容易?众说纷纭中,我们认为前谷歌大脑和斯坦福研究员Denny Britz的这篇评论文章相对中肯和理性,也得到了不少学者的力挺:"这个问题实际上比击败人类围棋
大数据文摘
2018/05/24
6640
OpenAI战胜DOTA2人类玩家是“里程碑式成就”?有专家评含金量不高
【新智元导读】上周,OpenAI Five击败DOTA2业余人类玩家,轰动游戏圈和AI圈,连比尔·盖茨都忍不住发推特点赞,称之为“里程碑事件”。这个事件对业界带来的影响有多大?技术含量有多高?新智元采访了数位国内外专家,他们并不全都赞同“里程碑”的观点。
新智元
2018/07/31
5040
OpenAI战胜DOTA2人类玩家是“里程碑式成就”?有专家评含金量不高
又输了!中国五位大神吊打,Open AI挥别Dota2赛场!
昨天第一场比赛输了之后,在今天Ti8表演赛中,OpenAI Five战队再次与人类交锋。
新智元
2018/09/25
7730
又输了!中国五位大神吊打,Open AI挥别Dota2赛场!
Dota2团战实力蔑视人类,解剖5只“AI英雄”
去年,OpenAI 在 DOTA 的 1v1 比赛中战胜了职业玩家 Dendi,而在距离进阶版 OpenAI Five 系统战胜人类业余玩家不过一个月的时间,今天凌晨,它又以 2:1 的战绩再次完成对人类高级玩家的“屠杀”,GG(人类赢的最后一局纯属耍赖)。
AI科技大本营
2018/08/17
5420
Dota2团战实力蔑视人类,解剖5只“AI英雄”
腾讯AI×王者荣耀「绝悟」项目首亮相:KPL秋季决赛击败顶尖战队
据机器之心了解,这是腾讯 AI Lab 与王者荣耀共同探索的研究项目——策略协作型 AI「绝悟」首次露面,并于昨天在KPL秋季决赛接受前职业 KPL 选手辰鬼、零度和职业解说白乐、九天和立人组成的人类战队(平均水平超过 99% 玩家)的水平测试。最终 AI 战队获得胜利。这是继围棋 AI「绝艺」后,腾讯 AI 在深度学习与强化学习领域的又一项前沿研究。
机器之心
2019/01/02
1.7K0
人类又双叒输了!Open AI完虐Dota顶级职业玩家,推塔如割草!
【新智元导读】OpenAI今天凌晨与DOTA2职业玩家队伍对战,并且以2:1的成绩战胜了人类玩家,这是AI历史上一个值得纪念的里程碑,意义或许比AlphaGo战胜李世石还要巨大!这意味着AI在需要团队配合的复杂决策实时战略电子竞技中,超过战胜人类职业玩家,AI的决策力、判断力和相互配合,都提升了一大步。
新智元
2018/08/16
4840
人类又双叒输了!Open AI完虐Dota顶级职业玩家,推塔如割草!
DOTA2中打败Dendi的AI如何炼出?OpenAI公布两周集训细节(含实战视频)
大数据文摘作品,转载要求见文末 编译 | 姜范波、Aileen、宁云州 导读:上个周末的Dota2人机大战引起了很多讨论,(点击链接查看大数据文摘文章《Dota2获胜的AI比AlphaGo厉害?还是媒体和马斯克的联合炒作》回顾剧情)。很多人都期待着打败人类顶级高手Dendi的OpenAI团队可以公布更多技术细节。今天他们终于满足了玩家和研究者的要求,更新博客的同时还公开了AI打败另外几个人类高手的精彩视频。 对于DOTA2人工智能训练的结果表明,如果计算够充分,自我对练可以将机器学习系统的性能从远低于人类
大数据文摘
2018/05/24
7570
人类奋起反击!OpenAI遭滑铁卢,Dota2顶级淘汰赛开场惨败!
51分钟的时间里,OpenAI Five虽然在控制速度和团队支援上远超人类,但金币数量只有一次稍稍领先,说明对英雄技能的释放以及兵线的理解还有待提高。
新智元
2018/09/25
4770
人类奋起反击!OpenAI遭滑铁卢,Dota2顶级淘汰赛开场惨败!
推荐阅读
【攻克Dota2】OpenAI自学习多智能体5v5团队战击败人类玩家
4990
一文解析OpenAI Five,一个会打团战的Dota2 AI
3.1K0
热点 | Dota 2被攻陷!OpenAI 人工智能5V5模式击败人类玩家(4000分水平)
4860
OpenAI:人工智能程序在Dota2的5V5比赛在中击败人类玩家
8190
击败DotA2顶级人类玩家,并不是AI的一次突破
6790
虽又击败了人类选手,但我们认为 OpenAI 的 5v5 DOTA AI 不过如此
3620
【中国战队包揽234却无缘冠军】OpenAI 的 Dota2 机器人强在哪?
1.2K0
【攻陷Dota2】马斯克的OpenAI自学习机器人完虐人类最强玩家
7760
OpenAI人工智能1v1击败Dota2最强玩家:明年开启5v5模式
7440
Dota2团战AI击败人类最全解析:能团又能gank,AI一日人间180年
3670
又输了,OpenAI Five完胜Dota 2半职业战队
7230
OpenAI人工智能1v1击败Dota2最强玩家:明年开启5v5模式
4210
DOTA2获胜的AI比AlphaGo厉害?还是媒体和马斯克在联合炒作?
6640
OpenAI战胜DOTA2人类玩家是“里程碑式成就”?有专家评含金量不高
5040
又输了!中国五位大神吊打,Open AI挥别Dota2赛场!
7730
Dota2团战实力蔑视人类,解剖5只“AI英雄”
5420
腾讯AI×王者荣耀「绝悟」项目首亮相:KPL秋季决赛击败顶尖战队
1.7K0
人类又双叒输了!Open AI完虐Dota顶级职业玩家,推塔如割草!
4840
DOTA2中打败Dendi的AI如何炼出?OpenAI公布两周集训细节(含实战视频)
7570
人类奋起反击!OpenAI遭滑铁卢,Dota2顶级淘汰赛开场惨败!
4770
相关推荐
【攻克Dota2】OpenAI自学习多智能体5v5团队战击败人类玩家
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档