好消息!
腾讯AI足球队获得了一项世界冠军。
这是 Google Research 与英超曼城俱乐部在 Kaggle 平台上联合举办的 11v11 足球 AI 竞赛。
由于其兼具挑战性和趣味性,一经推出便吸引海内外队伍踊跃参加,截至 12 月中旬,吸引了来自世界各地的 1100 多个团队,其中包含多支世界顶级学府和研究机构的科研强队。
最终——腾讯 AI Lab 绝悟 WeKick 版本(下称「绝悟」)以 1785.8 的分数获得冠军,且相比于其它队伍优势非常明显。
祝贺「绝悟」团队取得佳绩!
慢着,「绝悟」......不就是王者荣耀里的那个AI吗?
是的。足球他一样在行。
我们看到的足球比赛是这样的:
在AI的眼里,却是这样的:
(AI 的世界就是如此的朴素无华而枯燥)
比赛使用的 Google Research Football 环境,是基于开源足球游戏 Gameplay Football 开发的强化学习环境。
外表简陋,但和正常足球比赛一样没差,短传、长传、直塞、射门、铲球样样都有。
(其实,只是主办方为了节省计算资源,大部分比赛都没有经过3D渲染)
比赛绝对公平公正。
游戏场景是完全对称的,双方有一样的球员,没有主客场、状态好坏的数值差异,没有替补球员、没有加时赛、进球多获胜(否则平局)。
规则也与普通足球比赛类似——比赛分上下半场(各 45 分钟,1500 步,两支球队各开球一次),目标都是将球踢入对方球门。
好了,比赛开始:
对方开场势如破竹呀,只见对方10号传给了中插的5号,一脚抽射,应声入网。
「绝悟」0:1先丢一分。
可以看到,比赛中每个球员都各由一个单独的智能体控制,参赛团队需要实时选择并控制其中一个智能体,与其他内置智能体配合。
因此,每个球员不仅需要观察对手的行为,还需要留意己方队员的情况。这需要非常复杂的团队协作和竞争策略。
由于球场动态瞬息万变,因此高速的实时决策能力也是必需的。
(糟糕,解释的这一下,绝悟又丢失了一球)
「绝悟」0:2落后两分。
不过没关系,幸得绝悟有着极其丰富的团战经验。
我方7、8、9号三人相互配合,率先抢回一分。
紧接着,我方5号乘胜追击,接到9号一记妙传后,直抽龙门底角。
扳平!「绝悟」2:2。
赛点来了!我方10号把球直塞中路,8号反跑冲出,踢进制胜球。
最终「绝悟」3:2获胜!
踢足球的「绝悟」,和打王者的「绝悟」,到底是不是同一个?
答案:是的!
和大多数参赛队伍一样,「绝悟」也主要采用了强化学习和自博弈(Self-Play)来从零开始训练模型的方法。
其训练的基础架构是基于「绝悟」完全体的架构迁移得到的,详情参阅《腾讯绝悟AI完全体限时开放体验,研究登上国际顶会与顶刊》
基于此,腾讯 AI Lab 又针对足球任务对该框架做针对性改进,使其能适应 11 智能体足球游戏训练环境。
......(此次省略20218888个字)
这也证明了腾讯 AI Lab 开发的「绝悟」的底层架构与方法的通用性,可以预见这类方法未来还有望进一步迁移至机器人等更多领域,从而创造更大的实用价值。
从围棋 AI 「绝艺」到策略决策型 AI 「绝悟」,再到如今的 AI 足球队绝悟 WeKick 版本,腾讯 AI Lab 的深度强化学习智能体步步进化,逐渐向更复杂更多样化的问题迁移,其中的每一次进展都让我们离通用人工智能终极目标更近了一步。
领取专属 10元无门槛券
私享最新 技术干货