检视相片
第一款通才型自主学习人工智慧AlphaZero 同时打败围棋、将棋、西洋棋的世界顶尖AI (图/翻摄自DeepMind 网站)
更多
由人工智慧研发团队DeepMind 发表的AlphaZero 登上最新一期《科学》杂志封面。这已经不是DeepMind 第一次登上国外权威杂志的封面,每一次DeepMind 被报导都会获得人工智慧学界的一阵欢呼,这次更是如此。同时击败围棋、将棋、西洋棋最强AI 的AlphaZero ,被认为可能代表着深度学习AI 的终极解答。
《科学》杂志表示,如果人们想透过一套计算方式去解决多个不同的复杂问题,那么唯一能够达成这目标的办法就是,创造一个自主学习的人工智能系统,让它自行学着去解决问题。而AlphaZero 办到了。
视相片
(图/翻摄自fossbytes )
根据DeepMind 的介绍, AlphaZero 使用完全无需人工特征、无需任何人类棋谱、甚至无需任何特定最佳化的通用强化学习演算法。举例来说,由于围棋的规则明显和其他棋类如西洋棋、将棋不同,像是围棋的每一子都是完全相同的、且棋盘也是完全对称的。
为了因应围棋的特殊性, AlphaZero 的前身AlphaGo Zero 便有设计专为围棋使用的特殊计算程式。但AlphaZero 没有,作为一个「通用型」学习AI , AlphaZero 完全仅依靠深度神经网络和蒙特卡洛搜索树算法的自我学习。在完全没有输入人类的棋谱、没有输入特别设计的专用计算程式的情况下,只借着自我对弈的不断学习, AlphaZero 就已经能够分别在围棋将棋西洋棋击败了原本的世界最强AI 。
而且, AlphaZero 打败原本的西洋棋世界最强AI 只花了4 小时学习,打败原本的将棋世界最强AI 只花了2 小时学习。打败原本的围棋世界最强AI 只花了30 小时学习。AlphaZero 最大的特色就是可以学会并精通不同的棋类竞赛,而且它每一步棋所须计算的可能性变化,比之前的AI 要来得少许多。换句话说, AlphaZero 并不是去无限量的计算棋盘所有可能性,而是透过自己的深度神经网络研判,专注于小范围的计算。
视相片
(图/翻摄自DeepMind 网站)
这样的「思考模式」,其实正和一般人类棋士无异。西洋棋前世界冠军Garry Kasparov 就表示, AlphaZero 的下棋风格灵活多变,「和我很像!」,且不同于其他AI 程式倾向保守的先求立于不败, AlphaZero 非常具有侵略性,更喜欢冒险。传统的人工智慧程式在下棋时,凭借强大计算能力很少犯错,但在面对不清楚「该计算什么」的局面时,便容易出现失误。反观AlphaZero ,它呈现出的是一种「感觉」、「洞察」,一种对棋盘上局势发展的直觉。
曾和AlphaGo Zero 对奕的围棋棋士李世石便说过「我改变了看法, AlphaGo Zero 不只是机器,它具有创造性」。而现在同时精通围棋将棋西洋棋的AlphaZero ,显然拥有更强更灵活的创造能力。
过往的人工智慧程式,往往只能精通专一领域,只能处理特定情境的问题。但AlphaZero 不同,它能够适应各种规则。这让人相信,未来可以将这深度自主学习的AI 能力,运用在其他问题上。比如说, DeepMind 团队开发的最新家族成员AlphaFord ,便是投入在学习基因序列的蛋白质结构相关问题。假如在此领域AlphaFord 也能获得惊人成就,那可不同于在棋类竞赛赢过对手,将会真正替人类社会带来巨大改变。
下一次登上封面的会否就是AlphaFord ?深度学习的人工智慧究竟能发展到何种里程碑,让我们一起期待吧。
领取专属 10元无门槛券
私享最新 技术干货