前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【兵棋工程总师点评】AlphaGo 的胜利与未来战争变革的曙光

【兵棋工程总师点评】AlphaGo 的胜利与未来战争变革的曙光

作者头像
新智元
发布2018-03-14 18:18:36
8630
发布2018-03-14 18:18:36
举报
文章被收录于专栏:新智元

胡晓峰,国防大学教授,少将军衔,兵棋工程总师。兼任中国系统仿真学会副理事长,军事运筹学会副理事长等职。长期从事智能化战争模拟及军事系统工程教学与研究工作,出版专著11部,获得国家科技进步奖3项。

万众瞩目的AlphaGo与李世石的围棋五番棋大战,最终以4:1的最终结局,宣告人类在又一个引以为傲的智能高地上败北。如果这仅仅是“深蓝”战胜人类事件的重演,倒也没有什么可以大惊小怪的。但是,AlphaGo带给我们的却是更多惊讶,以及惊讶之余的思考。虽然,悲观论者由此而开始担忧人类命运未免有点杞人忧天,但如果不能从中发现暴风雨到来之前给我们发出的信号,那我们国家和军队也就有可能在未来面临重大的挑战。AlphaGo的胜利对未来战争揭示了什么?又带给了我们什么启示?这需要我们在“大战”之后的平静中重新思考。

1、AlphaGo做到了什么?

在人机大战的五盘对弈中,透过弥漫的“硝烟”和各种各样的“喧哗”,我们看到AlphaGo到底做了些什么使我们感到惊讶?我觉得以下三点特别值得关注:

第一,与“深蓝”完全不同的学习能力。1997年“深蓝”战胜国际象棋大师卡斯帕罗夫,但它的意义完全不能同AlphaGo相比。这是因为AlphaGo的核心技术是深度学习方法,也就是说,它的围棋知识不是像“深蓝”那样是编在程序里的,而是它通过大量棋谱和自我对弈自己学会掌握的。而且,这种学习能力具有相当大的通用性。自己学习的能力,使得计算机有了进化的可能;而通用性,则使其不再局限在围棋领域。尽管这个能力目前还很初级,但却展现了极好前景,使得以前困扰我们的人工智能自我学习问题,有了解决的可能。这是一个很大的创新和进步。

第二,局部落子和整体棋局着法的平衡能力。AlphaGo通过深度学习产生出来的策略网络(或称走棋网络),在对抗过程中可以实现局部着法的优化;通过估值网络实现对全局的不间断的评估,用于判定每一步棋对全局棋胜负的影响。而且,还可以通过快速走子算法和蒙特卡洛树搜索机制,加快走棋速度,实现对弈质量和速度保证的合理折衷。这些技术使得计算机初步可以既考虑局部得失,又考虑全局整体胜负。而这种全局性“直觉”平衡能力,正是过去我们认为是人类独有的。

第三,超出人类对围棋博弈规律的理解能力。在五番棋的对抗过程中,从观战的超一流棋手讨论和反应可以发现,AlphaGo的着法有些超出了他们的预料,但事后评估又认为是好棋。有棋手就认为,人类真的可以向计算机学习围棋,加深对围棋规律的理解,觉得“它可能比我们更接近围棋之神”。这意味什么?意味着AlphaGo的深度学习算法,甚至可以从大数据中发现人类千百年来还未发现的规律和知识,为人类扩展自己知识体系开辟了新的认识通道。

这三点我认为对人工智能发展具有里程碑意义。可能有的人会认为,AlphaGo不过是一个围棋程序而已,离人类智能还有很大的距离,不值得我们如此看重。我承认,从人工智能的角度来看,AlphaGo的智能还只是非常初级的水平,无法与人类相提并论,但我为什么认为它具有里程碑意义呢?这就需要从机器智能的分类与应用说起。

一般说来,机器智能主要分为三大类:计算智能、感知智能和认知智能。在计算智能领域,以科学运算、逻辑处理、统计查询等形式化规则运算为核心,在有些方面计算机早已超过了人类,比如“天河”的科学运算和“深蓝”基于规则的暴力搜索。但也有些还无法超越人类,比如复杂符号推理。在感知智能领域,以图像理解、语音识别、语言翻译、运动控制等为代表,近期由于深度学习方法的突破,取得了重大进展,开始逐步趋于实用水平。比如谷歌的图片标注、讯飞的语音速记、机器人“大狗”等。但是,在认知智能领域,以理解、推理和决策为代表,强调“会思考”、“能决策”等,因其综合性更强,更接近人类智能,研究难度更大,长期以来一直进展缓慢。2011年出现的问答智能程序“沃森”、谷歌的无人车等,就是比较接近此类智能的典型。AlphaGo在深度学习技术上的突破,使其在自主学习、理解和推理能力上取得重大进步,使我们终于在认知智能方面看到了曙光,尽管现在还非常非常的初步。

深度学习方法在认知智能上的突破,技术上意味着我们可以在机器智能领域取得更大的进展,将原先止步不前的机器智能研究推向一个新的阶段。比如,感知智能技术会因此上一个很大的台阶,如图像理解程序就实现了自己学会认识“猫”。但在发展趋势上则意味着机器智能开始进入认知智能时代,也就是IBM说的“认知计算时代”。所以,我说AlphaGo的这个突破,与其他智能技术相比,可能更具时代里程碑的意义。

2、会对战争相关领域带来哪些影响?

一般说来,战争需求总是牵引着技术的发展。历史上一些著名的发明,比如计算机、因特网、激光、核裂变、卫星等,都是由战争需求牵引产生出来的,几乎无一例外。即使最初并没有想到用于战争,但一旦出现,它也会很快被纳入战争需求的轨道。另一项对技术牵引最大的需求则是医学,你会发现很多技术总是被首先用于医学领域,智能技术也不例外。这是因为战争会决定一个国家的命运,而医学则可以决定一个人的命运,任何人都不会等闲视之,都舍得投入巨资研发。那么,从战争需求的视角,我们从中可以看到什么样信号呢?

以深度学习方法为核心的认知智能的突破和发展,我觉得主要会在以下几个方面对战争相关领域产生重要影响:

第一,会催生更多的聪明武器和自主化无人平台。现在已经投入作战运用的无人平台,比如无人机,一般都是遥控的,还没有基本的自主决策能力,任何行动都像风筝一样,由后方操作员操纵。但认知智能的进步,会使无人平台逐步脱离操作员的控制,实现战场上的自主决策。这样,无人平台即使与后方失去联络,它也可以自主地去完成任务。如果果真如此,无人化战争也就指日可待。即使暂时还做不到完全自主,但任何认知智能技术的进步都会使武器装备变得更加“聪明”,提高武器装备的作战效果,或大大降低操作的复杂程度。

第二,会使指挥员对战场态势的认知速度大幅度提高。由于战场态势的复杂性,态势认知一般都由人来完成。比如对侦察情报的判读,面对各类手段获得的海量多媒体数据,人工分析效率极低。如果引入深度学习算法,仅仅判读目标图像一项,就可以大幅度提高情报分析的质量和速度,使得昂贵的侦察卫星不至于成为摆设。对综合性更强的战役态势分析来说,就需要更强的空间、时间、行动和条件约束的综合理解能力,很大程度上取决于指挥员的全局直觉判断能力。如果能够利用认知智能技术上的进步,利用计算机辅助指挥员去理解态势,无疑是很有帮助的,会大大提高对整个战场态势的认知速度,取得指挥控制上的敏捷性优势,掌握战场上的主动权。

第三,会使指挥信息系统克服智能辅助上瓶颈。指挥信息系统是作战能力的倍增器,但由于无法解决智能辅助问题一直无法升级换代。例如人机接口上的语音识别、草图交互等。在辅助决策、仿真评估上,则难题在作战方案的智能对接。基于深度学习的感知智能技术进步,估计将很快解决智能接口问题;但在辅助决策所需要的认知智能方面,差距还非常大。这是因为计算机在辅助决策时,无法预估对手会采取什么样的反应,而且战争复杂性导致的不确定性存在,使得后续行动也无法事先确定。所以,这就要求系统必须有智能化的认知理解能力,能够看懂态势并能根据实际作出判断和处置。

第四,会助推兵棋推演实现真正的人机对抗。兵棋不是“棋”,而是逼真的战争模拟系统,但它现在还很难完全自动地模拟出对手的复杂行为,还需要由专门训练的人扮演敌军。但是,这种被红军思维潜移默化影响多年的蓝军,很难避免“红军”的思维特点,使得“红蓝对抗”变成了“红红对抗”,推演效果大打折扣。认知智能的进步,使得计算机可以逼真地扮演对手,即“机器蓝军”,就像李世石与AlphaGo对抗一样,这样的推演结果才会更加可信,演习效果也可大大提高。这一点,无论在高层的战略、战役模拟,还是在低层的战斗模拟,都非常需要。这种对战争对手、社会和环境逼真模拟,非要认知智能技术的进步不可。

第五,会拓展认识信息化战争机理的新途径。这是最值得重视的方面。在AlphaGo人机大战之前,我们谁也没有想到这一点,但整个对弈过程给了我极大的启示。AlphaGo不仅在人类的知识体系里面“思考”,而且还展现了找到人类知识体系之外规律的迹象,这不能不说是一个惊喜。这告诉我们,在很多现在还找不到相应科学知识加以解释的经验学科方面,是不是通过深度学习方法和大数据的结合,能够帮助我们去理解和总结相应的知识呢?比如依赖千百年经验的中医学科,以及同样依赖经验的军事学科和社会学科等。如果果真如此,那带给我们的就不仅仅是人工智能技术的进步,而是在认识论、方法论上的进步了!

但是必须注意,AlphaGo博弈与战争的对抗差别极大。AlphaGo是在围棋固定规则下的完全信息博弈,而且具有大量人类对弈的样本可以利用,因而通过深度学习才有涌现出围棋智能的可能。而战争则是不完全信息乃至虚假信息下的对抗,规则和目标也并不固定,尤其是缺乏可供学习的参考样本。这给深度学习带来极大的困难。

因此,就必须结合更多的智能技术,例如将“沃森”的基于自然语言的知识获取和统计推理技术、基于贝叶斯方法的复杂概念建模技术,也包括“深蓝”的基于规则驱动的暴力搜索技术等。样本数据的获取也可以通过对战争历史、对抗推演、靶场试验、局部自动交互仿真等多种方式获得。只有这样,才有可能创新出对战争对抗规律理解的深度学习方法方法。

3、我们应该如何应对?

虽然AlphaGo的进步是非常初步的,但它却像一个神启,告诉了我们未来战争会是怎样,尽管那还非常遥远。但一旦实现,那就是一个新的时代,即所谓“智能化战争”的时代,必将取代现在的信息化战争时代。因此,我们不能袖手旁观。

第一,更新时代观念。这是永不过时的命题,因为时代总是在发展,有时快,有时慢,但绝不会停止。现在我们必须意识到,战场上对抗不仅仅行动要快,即所谓“快鱼吃慢鱼”;而且还要意识到,由于机器智能的突破,会带来认知速度、学习速度的比拼,也就是认知要快,“巧鱼吃笨鱼”,未来认知速度将成为决定胜负的关键。这是不同时代的技术带来的时代差,同时代尚可“以弱胜强”,但若处于不同时代则根本没有这个可能。而提高认知速度最可行的途径,就是首先实现人的智能与机器智能的结合,卡斯帕罗夫和李世石战败后都认为未来必须如此。

第二,突破关键技术。关键在于创新和一定规模的探索。我国的深度学习、机器智能技术基础研究应该说并不比其他国家慢,这点从发表的论文中就可以看出。但是,我们现在缺的是将这些理论进行转化的关键技术,可以展现实际应用效果的牵引性示范项目,以及创新团队的领军人才。我们必须将人工智能技术作为战略核心技术加以关注和支持,并加大投入,培育队伍,才不会让我们在未来的竞争中再次落后。谷歌公司2012年深度学习项目仅有不到100个,而在2015年就超过了2700多个,可见它的重视程度。

第三,防止技术突袭。必须防止出现颠覆性的技术突袭。美国已经意识到了这一点,并且已经展开了大规模的研究布局,意图像抢占互联网霸权那样,再次抢占认知智能领域的霸权。它们的脑计划等就说明了这一点。DARPA认为,未来智能项目重在人机结合,所以起名“半人马项目”,以应对第三次抵消战略的需要。其重点目标在无人机群、智能雷达、网络作战,以及应对情报的数据洪流方面。国防部以及美军各军兵种,都将人工智能或类似相关研究作为了未来突破的重点,以期未来有所突破。因此,我们必须加以重视,防止出现对我们非常不利的技术突袭。AlphaGo可以说就是一个对我们的重要技术预警信号。

AlphaGo的胜利,使得我们已经听见了智能化战争时代的敲门声。虽然还很遥远,也还有那么多的不确定性,但我们也必须赶快起来打开门户,去迎接智能化战争的到来。新时代的曙光已经初现,太阳终究必将升起,它不会理会你是否已经起床,是否已经做好准备,这是战争变革的必然规律。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2016-03-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 新智元 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
语音识别
腾讯云语音识别(Automatic Speech Recognition,ASR)是将语音转化成文字的PaaS产品,为企业提供精准而极具性价比的识别服务。被微信、王者荣耀、腾讯视频等大量业务使用,适用于录音质检、会议实时转写、语音输入法等多个场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档