近日,DeepMind在arXiv发表论文表示,AlphaGo Zero已开始尝试完成其他任务,其现已具有通用性。
DeepMind团队目前一直以推动人工智能的界限,开发可以学会解决任何复杂问题而不需要学习的程序为自身使命。在今年年初,其已经引入了一种“强化学习”(reinforcement learning)的AI技术来增强AlphaGo,这个技术不需要人类输入信息,只需要制定规则,它就可以自己获得超人一般的技法。
DeepMind举了两个例子,表示AlphaGo Zero可以自己学习国际象棋和将棋,只需要24小时,它就可以达到击败世界冠军的水平。(这两个游戏相比较围棋而言,较为简单)
AlphaGo Zero的通用性可使其掌管各种不同的游戏,这无疑是可以让机器学习能力越来越强,但是目前其还无法在策略性游戏(如星际争霸)超过人类,但是相信以其恐怖的学习能力那一天也不会太遥远。
领取专属 10元无门槛券
私享最新 技术干货