人类再次完败AI,《星际争霸》也被AI攻陷,10比0暴击人类!
谷歌旗下人工智能部门DeepMind开发的人工智能(AI)程序“AlphaStar”(阿尔法星际)今日凌晨挑战《星际争霸2》游戏。结果是:名为“AlphaStar”的人工智能在与两位人类职业选手“TLO”和“MANA”的比赛中,均以5比0取胜。这给了职业电竞界一次不小的暴击。这项人工智能挑战是在2016年的暴雪嘉年华开幕式上所宣布,由DeepMind 和暴雪共同开发的,前者曾开发出了击败世界围棋第一人柯洁等人的阿尔法狗。
AlphaStar跟AlphaGo有些类似,最开始都是通过学习人类选手的Replay(比赛录像)来提升水平。直播中展示的10场比赛都是在一张相同的比赛地图上进行,而且都是神族内战。人工智能的APM(每分钟操作的次数)限制在与人类选手相仿的程度。
AI在信息对等的情况下,临机应变的能力不如人类,星际需要玩家对资源控制,升级先后顺序,不同种族和兵种相互克制等方面有整体的认识。这种互相牵制的效果,即是游戏平衡性的由来。这方面的整体考虑远比下围棋时只考虑黑子和白子的位置更加复杂。考虑到人工智能在APM手速和精确微操方面优势明显,这可能成为另外一个能决定比赛最终结果的重要因素。不过正如暴雪和DeepMind团队强调过,未来的人工智能并不会拥有非人类的逆天操作,他们将会通过限制人工智能的APM来保证它的操作,也会有类似人类的极限和失误。
DeepMind团队相信,这个进化了的模型,可以为许多其他机器学习领域的难题带来帮助:主要针对那些涉及长期序列建模、输出空间很大的问题,比如语言建模和视觉表示。AlphaStar还用了一个新的多智能体学习算法。这个神经网络,经过了监督学习和强化学习的训练。最开始,训练用的是监督学习,素材来自暴雪发布的匿名人类玩家的游戏实况。这些资料可以让AlphaStar通过模仿星际天梯选手的操作,来学习游戏的宏观和微观策略。
领取专属 10元无门槛券
私享最新 技术干货