首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

人工智能进入游戏界

1月26日,我们自动化学院发生了一件大事:华中科技大学人工智能与自动化学院,人工智能研究所成立了。这标志着我们学院也将加入人工智能研究的潮流中。

最近人工智能又一次向人类发起了挑战,让我们一起来看看吧!

在1月25日,人工智能让星际争霸2这个经典游戏上了头条。北京时间凌晨2:00,DeepMind发布了一段AI与两位职业选手的比赛视频。这次比赛中的AI是首次出现在公众面前的AlphaStar。该两位职业选手却分别以0:5和1:5的成绩败给了人工智能

(DeepMind伦敦总部的直播)

那么为什么会选择星际争霸2这个游戏呢?

在游戏领域,人工智能胜过人类似乎不是什么大事。但星际争霸2却是以操作难度大而著称的RTS游戏(Real Time Strategy即时策略游戏)。其比赛具有较强的竞技性与策略性。而且通过几场比赛就能看出比赛双方的差距。Alpha Zero的设计者甚至说:“这个可比围棋难多了。”正是因为在游戏中需要考虑的东西增加,这也是一个极好的训练AI的方式。

而在比赛中,AlphaStar的设计师也给它加了许多限制,比如操作延迟,APM上限(Actions Per Minute,即每分钟操作次数),视角限制等。可这些仍然不能阻止AlphaStar在比赛中那非人般的微操技巧。即使是职业选手也难以达到这样的水平。

(AI与人类的APM对比)

这次比赛中代表人类出战的两位职业选手分别是TLO与MaNa,其中TLO用的是自己不擅长的种族。虽然结果不甚理想,但人类选手在战术和战略上是比AlphaStar要高出一点。而AlphaStar在操作上超过人类。

从战术来看,AlphaStar并没有太高明,只是单纯地靠手速与精确的操作来压制人类。所以也有人说,AlphaStar没有真正胜利,人类在星际争霸2这个领域仍然占有统治地位。这与AlphaStar的学习方法有关。

为了训练AlphaStar,DeepMind公司的研究人员使用了一种称为强化学习的方法。AI软件实体为了达到某些目标(如获胜或仅仅是活着),基本上是通过反复试验来玩这个游戏的。他们首先通过模仿人类玩家来学习,然后在游戏竞技比赛中互相学习。在不同的AI软件实体中,强者生存,弱者被抛弃。DeepMind估计,它的每一个AlphaStar软件实体都以这种方式积累了大约200年的游戏时间,随着游戏积累,它们玩游戏的速度也越来越快。

(AlphaStar处理信息的过程)

不过这样的学习也存在缺陷。佐治亚理工学院人工智能副教授马克·里德尔(Mark Riedl)说,他对游戏比赛结果并不感到惊讶,人工智能击败人类玩家只是一个时间问题。他补充道“但我们看到的更大问题…是人工智能所学到的策略是脆弱的,当一个职业玩家把人工智能玩家逼出舒适区时,人工智能就会崩溃。”

(MaNa仅有的一局胜利)

DeepMind公司的研究负责人大卫·西尔弗(David Silver)在比赛结束后表示:“人工智能在不同的游戏比赛中取得的成绩,成为人工智能发展的重要里程碑。我希望——尽管显然还有工作要做——未来的人们可能会回顾今天,并认识到这是人工智能系统潜在能力又迈出的重要一步。”

而AlphaStar项目的负责人Oriol Vinyals说“最重要的是,DeepMind的任务是构建一种通用的人工智能系统。”他指的是建立一个能执行人类所能完成的任何心理任务的人工智能软件实体。要做到这一点,重要的是要对我们的人工智能软件实体在各种任务中的表现进行测评对比。

实际上人工智能在围棋,象棋,国际象棋上战胜了人类,就已经显示出棋类的通用AI的雏形了。然而最近DeepMind公司的AlphaStar也是在为进一步发展通用游戏AI做准备。

然而AlphaStar与人类的比赛还没有结束,在2月15日,AlphaStar将与获得WSC2018世界冠军的芬兰选手Serral进行比赛,在这期间AlphaStar会继续学习,相信那会是一场更加精彩的比赛。

文案:唐盛霖

排版:唐盛霖

图片源于网络

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190203B0TKDX00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券