首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

腾讯AI足球队获世界冠军!

好消息!

腾讯AI足球队获得了一项世界冠军。

这是 Google Research 与英超曼城俱乐部在 Kaggle 平台上联合举办的 11v11 足球 AI 竞赛。

由于其兼具挑战性和趣味性,一经推出便吸引海内外队伍踊跃参加,截至 12 月中旬,吸引了来自世界各地的 1100 多个团队,其中包含多支世界顶级学府和研究机构的科研强队。

最终——腾讯 AI Lab 绝悟 WeKick 版本(下称「绝悟」)以 1785.8 的分数获得冠军,且相比于其它队伍优势非常明显。

祝贺「绝悟」团队取得佳绩!

慢着,「绝悟」......不就是王者荣耀里的那个AI吗?

是的。足球他一样在行。

我们看到的足球比赛是这样的:

在AI的眼里,却是这样的:

(AI 的世界就是如此的朴素无华而枯燥)

比赛使用的 Google Research Football 环境,是基于开源足球游戏 Gameplay Football 开发的强化学习环境。

外表简陋,但和正常足球比赛一样没差,短传、长传、直塞、射门、铲球样样都有。

(其实,只是主办方为了节省计算资源,大部分比赛都没有经过3D渲染)

比赛绝对公平公正。

游戏场景是完全对称的,双方有一样的球员,没有主客场、状态好坏的数值差异,没有替补球员、没有加时赛、进球多获胜(否则平局)。

规则也与普通足球比赛类似——比赛分上下半场(各 45 分钟,1500 步,两支球队各开球一次),目标都是将球踢入对方球门。

好了,比赛开始:

对方开场势如破竹呀,只见对方10号传给了中插的5号,一脚抽射,应声入网。

「绝悟」0:1先丢一分。

可以看到,比赛中每个球员都各由一个单独的智能体控制,参赛团队需要实时选择并控制其中一个智能体,与其他内置智能体配合。

因此,每个球员不仅需要观察对手的行为,还需要留意己方队员的情况。这需要非常复杂的团队协作和竞争策略。

由于球场动态瞬息万变,因此高速的实时决策能力也是必需的。

(糟糕,解释的这一下,绝悟又丢失了一球)

「绝悟」0:2落后两分。

不过没关系,幸得绝悟有着极其丰富的团战经验。

我方7、8、9号三人相互配合,率先抢回一分。

紧接着,我方5号乘胜追击,接到9号一记妙传后,直抽龙门底角。

扳平!「绝悟」2:2。

赛点来了!我方10号把球直塞中路,8号反跑冲出,踢进制胜球。

最终「绝悟」3:2获胜!

踢足球的「绝悟」,和打王者的「绝悟」,到底是不是同一个?

答案:是的!

和大多数参赛队伍一样,「绝悟」也主要采用了强化学习和自博弈(Self-Play)来从零开始训练模型的方法。

其训练的基础架构是基于「绝悟」完全体的架构迁移得到的,详情参阅《腾讯绝悟AI完全体限时开放体验,研究登上国际顶会与顶刊》

基于此,腾讯 AI Lab 又针对足球任务对该框架做针对性改进,使其能适应 11 智能体足球游戏训练环境。

......(此次省略20218888个字)

这也证明了腾讯 AI Lab 开发的「绝悟」的底层架构与方法的通用性,可以预见这类方法未来还有望进一步迁移至机器人等更多领域,从而创造更大的实用价值。

从围棋 AI 「绝艺」到策略决策型 AI 「绝悟」,再到如今的 AI 足球队绝悟 WeKick 版本,腾讯 AI Lab 的深度强化学习智能体步步进化,逐渐向更复杂更多样化的问题迁移,其中的每一次进展都让我们离通用人工智能终极目标更近了一步。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20201230A0IX6E00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券