Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >专栏 | 阿尔伯塔大学李玉喜博士:我们应该如何面对强大的计算机围棋AlphaGo?

专栏 | 阿尔伯塔大学李玉喜博士:我们应该如何面对强大的计算机围棋AlphaGo?

作者头像
机器之心
发布于 2018-05-07 09:01:09
发布于 2018-05-07 09:01:09
1.2K0
举报
文章被收录于专栏:机器之心机器之心

机器之心专栏

作者:李玉喜

AlphaGo 与世界第一的人类棋手柯洁的对弈比赛已经引起了全世界的广泛关注。不出意外,尽管柯洁表现出色,但 AlphaGo 仍然连续取得了两场胜利。明天柯洁还将与 AlphaGo 展开最后一场比赛,是否会出现意外惊喜,让我们拭目以待。最后的比赛之前,加拿大阿尔伯塔大学计算机系博士、博士后李玉喜撰写了一篇解读 AlphaGo 背后的技术以及讨论我们应该如何应对这些技术的文章。李玉喜博士致力于深度学习强化学习、机器学习、人工智能等前沿技术及其应用。曾任电子科技大学副教授;在美国波士顿任资深数据科学家等。他在 2017 年 1 月在 arXiv 上发表了《Deep Reinforcement Learning: An Overview(深度强化学习综述)》论文。

人类应该如何面对强人工智能?强化学习之父 Rich Sutton 给出的建议是:妥协、合作。

强人工智能还比较弱,离我们可能还很远;弱人工智能却已经非常强了,已经离我们很近。我们需要思考,应该如何面对强大的人工智能?

最近的一个技术突破是在图像识别领域:借助深度学习技术,图像识别准确率已经超过人类。接下来的事情很可能是计算机代替医生看片子。事实上,科学技术的发展导致机器在某个领域超过人类的例子比比皆是,汽车、飞机、机器、电话、Internet,等等,我们都已经习以为常了。现在我们说说围棋。

围棋是一项古老的智力游戏,规则很简单,但下起来非常复杂。几千年来,棋手总结了很多宝贵的经验。在国际象棋上面,人工智能虽然没有完全解决,但是已经远远超过了人类水平。围棋对计算机却非常难。为什么?

  1. 搜索空间非常大,据估算是 250 的 150 次方,比宇宙中的原子数目还多,而国际象棋的搜索空间是 35 的 80 次方;
  2. 很难对当前局面进行评估,建立评估函数。

AlphaGo 做了什么?为什么这么强大?AlphaGo 创造性地整合了深度学习、强化学习、蒙特卡洛搜索树等方法,在学习前人优秀棋谱的基础上,设计出一套比较强的策略;之后,在这个策略的基础上,通过自我学习改进策略;在对弈期间,通过整合策略网络、价值网络、蒙特卡洛搜索树、快棋策略等关键技术手段,寻找赢面最大的落子策略。这个是发表于 Nature 的版本,也是打败韩国顶尖棋手李世乭的版本。

AlphaGo Nature 论文中神经网络训练流程和架构示意图

2017 年对战柯洁的 AlphaGo 有什么改进?根据目前收集到的资料,包括 David Silver、Jeff Dean、Demis Hassabis 等人的演讲,我们可以得到的结论是:更准确的策略网络和价值网络。下面对其进行了比较详细地讨论。

AlphaGo 核心技术包括深度学习、强化学习、蒙特卡洛搜索树等。深度学习利用深度神经网络,可以不用或尽量少地依赖研发人员对所研究问题的理解,自动从数据中抽取关键信息,帮助进一步的评估、决策。强化学习是一种决策模型,可以通过观测到的数据,通过试错,不断提高决策能力。蒙特卡洛搜索树则基于统计理论,尽量少地采样数据同时尽量保证评估和决策质量;对围棋来讲,采样是通过模拟下到终局。

策略网络是说,在当前的棋局,判断每一个可能落子点的优劣程度,从而得到最优策略是什么。价值网络是用于判断棋手在当前棋局的胜率几何。AlphaGo 的自我学习是指,通过自己不同版本之间的对弈产生大量训练数据,通过策略网络、价值网络、蒙特卡洛搜索树等技术,不断提高策略网络和价值网络的准确度。新版 AlphaGo 很可能的一个改进是把策略网络、价值网络、蒙特卡洛搜索树、快棋策略等关键技术深度整合,不断迭代,螺旋式上升提高策略网络和价值网络的准确度,大幅度提高棋力。新版 AlphaGo 中的深度神经网络从 12 层增加到了 40 层,也为提高准确度提供了体系结构上的基础。

2016 年的 AlphaGo 版本,通过借鉴人类棋谱和强化学习的自我学习,已经达到了很高的水平,打败了李世乭。2017 年初有 60 连胜的战绩。DeepMind 的演讲中提到 AlphaGo Master 的围棋等级分达到 4500;而从网上查到柯洁 1 月份的等级分不足 3000。根据这样的等级分,可以说 AlphaGo 的棋力已经远远超过人类棋手的水平。当然这个等级分可能不够官方,但有一定的参考意义。

从这个角度说,AlphaGo 现在可以不用人类专家的数据进行训练。不过需要注意的是,这并不是说一开始训练计算机围棋程序就不需要人类棋手的棋谱数据——AlphaGo 是通过这些数据成长起来的——这些人类棋谱,帮助 AlphaGo 更好地为神经网络设了初始值。完全脱离人类棋手的棋谱,理论上并非完全不可能,但效率会非常低,应该是不可取的。与柯洁这样的顶尖棋手对弈,也可以作为 AlphaGo 训练的有益参考。不过,AlphaGo 已经可以找到水平比人类棋手高很多的「对手」,产生大量高质量数据,通过自我学习,不断提高水平。通过与超高手(AlphaGo 自己不同版本)的对弈,AlphaGo 已经有能力应对很复杂的局面,包括复杂的劫争;这些复杂局面基本都在策略网络和价值网络以及蒙特卡洛搜索树的考虑范围之内。我们在前面的对弈中也可以发现,AlphaGo 走出了人类棋手从来没有走过的棋。

AlphaGo 对策略网络和价值网络的训练是离线进行的,需要消耗大量的人力、计算等资源。比赛时的计算量主要体现在蒙特卡洛搜索树上。2016 年对战李世乭的 AlphaGo 的策略网络、价值网络还远不完善。这样,一方面,AlphaGo 需要蒙特卡洛搜索树寻找赢面最高的策略;另一方面,AlphaGo 需要用搜索的深度和广度来补偿策略网络和价值网络的准确度带来的不足。结果就是计算量或搜索量很大。而通过进一步的训练,AlphaGo 提高了策略网络和价值网络的准确度,就可以通过较少的搜索寻找到质量很高的应对策略。这是为什么我们看到 AlphaGo 可以在一台配备 TPU 的计算机上运行的原因。

一个彻底优化的强化学习算法,可以只通过策略函数或价值函数来做出最优决策。就是说,在理想情况下,训练过的 AlphaGo 可以只通过策略网络或价值网络,而不用蒙特卡洛搜索树,就可以直接找到最优应对策略。到那个时候,AlphaGo 程序就可以运行在手机上了。当然,这是理想情况,目前在对弈时还需要与蒙特卡洛搜索树配合,原因如上面所说,海量的搜索空间和复杂的评估函数。

计算机围棋是一个优化问题,优化问题有优化目标函数。AlphaGo 因为引入了机器学习以及蒙特卡洛搜索树,就引入了随机性。Nature 论文里面的算法是以赢为目标,最大概率赢棋。DeepMind 的演讲谈到 AlphaGo 的目标仍然是最大概率地赢棋。计算机围棋也可能有其它目标,比如尽量大幅度地赢棋,但这样很可能要以损失赢棋概率为代价。如果大幅度赢棋也是一个目标,那么计算机围棋程序应该兼顾赢的概率,否则可能适得其反。

AlphaGo 的潜在缺陷在于模型仍未完美,比如,策略函数和价值函数并没有完全准确,蒙特卡洛搜索树是一种模拟、采样方法,无法 100% 保证准确等。机器学习方面的研发人员应该了解,AlphaGo 模型不完美的问题存在于所有基于机器学习的模型中;通过不断完善模型,我们可以得到比较满意的结果。计算机围棋的不完美,人类大脑的计算能力很可能没有能力把它诱发出来,甚至没有能力捕捉到这样的机会。通过深度强化学习等人工智能算法和强大的计算能力,人类棋手很可能已经没有机会向最优秀的计算机围棋程序挑战了。

我们讨论了很多 AlphaGo 的技术细节。那么,我们应该如何面对强大的计算机围棋 AlphaGo?

AlphaGo 是人类的胜利,是人类对智能的理解取得了突破。人类也应该更好地利用这样的进步。对围棋棋手来讲,AlphaGo 或其它优秀的围棋程序,是很好的教练和陪练伙伴;对更广泛的学术界、工业界,甚至政府等部门,需要合理分配资源、制定政策,应对 AlphaGo 核心技术(包括深度学习、强化学习、蒙特卡洛搜索树等)或者说更宽泛的人工智能技术对科学、工程技术、社会等带来的深远影响。如果我们拒绝技术进步、技术革命,很可能的结果是我们自己会被时代抛弃。另一方面,目前人工智能的发展,尤其 AlphaGo,仍然在弱人工智能阶段,所研究的问题还需要有比较明确的规则;而在强人工智能方面,比如推理、抽象、意识、情感等方面,人工智能还在进步;人类对大脑、人本身还在不断探索。

我们人类也曾经面对汽车、飞机、机器、电话、Internet 等技术进步、技术革命。人类对这样的进步、革命的策略一贯是妥协、合作。让我们拥抱、促进人工智能的进步、发展,创造更辉煌的明天。

参考资料

1. Silver, D., Huang, A., Maddison, C. J., Guez, A., Sifre, L., Van Den Driessche, G., Schrittwieser, J., Antonoglou, I., Panneershelvam, V., Lanctot, M., et al. (2016). Mastering the game of go with deep neural networks and tree search. Nature, 529(7587):484–489.

2. Sutton, R. S. and Barto, A. G. (2017). Reinforcement Learning: An Introduction (2nd Edition, in preparation). Section 16.7. http://incompleteideas.net/sutton/book/the-book-2nd.html

3.Li, Y., Deep Reinforcement Learning: An Overview 深度强化学习综述论文,https://arxiv.org/abs/1701.07274.

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2017-05-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器之心 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
【柯洁战败解密】AlphaGo Master最新架构和算法,谷歌云与TPU拆解
【新智元发自中国乌镇】乌镇人工智能峰会进入第二天,哈萨比斯、David Silver和Jeff Dean等谷歌高管纷纷发表演讲。他们对AlphaGo 2.0的新技术进行了详细解读。几位“谷歌人”纷纷提到一个关键词——TPU。Jeff Dean 甚至直接放出了与GPU的性能对比图。从昨天的赛后采访到今天的主旨演讲,哈萨比斯等人一直在强调TPU对新版本的AlphaGo的巨大提升。看来,TPU将会成为接下来一段时间内谷歌的战略重点,GPU要小心了。本文带来哈萨比斯、David Silver现场演讲报道(附PPT)
新智元
2018/03/28
1.5K0
【柯洁战败解密】AlphaGo Master最新架构和算法,谷歌云与TPU拆解
AI 网红 Andrej Karpathy:为什么 AlphaGo很难应用到围棋以外的世界?
【新智元导读】 Karpathy在文章中谈到了AlphaGo技术中一些很酷的部分,以及,从围棋的7大属性出发,谈到了AlphaGo常常被人忽视的一些局限性。 我最近有幸跟几个人聊到了AlphaGo与柯洁等棋手的比赛。特别是,大多数的报道都是大众科学+PR的混合体,所以,最常见的问题就变成了“AlphaGo的突破性表现在什么地方?”“AI研究者如何看待AlphaGo的胜利”以及“ 胜利的意义在哪?” 我想,针对这些问题,我有一些自己的想法。 一些很酷的部分 AlphaGo 是由一系列相对来说比较基础(sta
新智元
2018/03/28
8500
AI 网红 Andrej Karpathy:为什么 AlphaGo很难应用到围棋以外的世界?
AlphaGo Zero幕后开发心路历程大公开!DeepMind资深研究员黄士杰最新演讲解密
【导读】11月10日,黄士杰应台湾人工智能年会之邀来台演讲,演讲主题是「AlphaGo——深度学习与强化学习的胜利」,也是他首次公开演讲。不久前,在DeepMind发表了《Mastering the game of Go without humanknowledge》的最新论文后,黄士杰曾在Facebook写下:AlphaGo Zero是完全脱离人类知识的AlphaGo版本。在演讲上,他强调,DeepMind的目标是要做出一个通用人工智能,也就是强人工智能,但他也认为,对DeepMind来说,强人工智能还是
WZEARW
2018/04/10
1.1K0
AlphaGo Zero幕后开发心路历程大公开!DeepMind资深研究员黄士杰最新演讲解密
《自然》论文详解:AlphaGo 背后的深度神经网络和树搜索
Nature 封面论文:Mastering the game of Go with deep neural networks and tree search(通过深度神经网络和树搜索,学会围棋游戏) AlphaGo 给围棋带来了新方法,它背后主要的方法是 Value Networks(价值网络)和 Policy Networks(策略网络),其中 Value Networks 评估棋盘位置,Policy Networks 选择下棋步法。这些神经网络模型通过一种新的方法训练,结合人类专家比赛中学到的监督学习,
新智元
2018/03/14
4.3K0
《自然》论文详解:AlphaGo 背后的深度神经网络和树搜索
深入浅出解读并思考AlphaGo
;其次我们要想一下我们下了某一步之后局面会怎么变化,对方会怎么下,我们又怎么接着对方的棋往下下,我们把这种思考叫做思考的深度
CristianoC
2021/03/11
9110
深入浅出解读并思考AlphaGo
现场报道 | 让天下三子,DeepMind官方解读新版AlphaGo强大实力
机器之心原创 记者:杜夏德 参与:李泽南、吴攀 5 月 23 日,乌镇围棋峰会第一场人机大战以柯洁落败而结束,DeepMind 和谷歌在今天的人工智能高峰论坛中详细回顾了昨天的比赛,并解读了 AlphaGo 背后的强大实力。 第一天比赛结束,DeepMind 创始人 Hassabis 表示,比赛进入了数子阶段,AlphaGo 的优势很小,柯洁完成了一场伟大的比赛。竭尽全力的柯洁表示,此次大赛之后不但不会再与机器交战,也不会利用机器来练习,他「更喜欢与人类棋手下棋,这样自己还有赢的可能。」 比赛之后,Deep
机器之心
2018/05/07
8020
现场报道 | 让天下三子,DeepMind官方解读新版AlphaGo强大实力
仅用3天,AlphaGo Zero就凭借自学以100:0击败AlphaGo,柯洁表示人类太多余了
AlphaGo Zero3天时间就能达到击败李世石的AlphaGo Lee的水平,21天可以达到了之前击败柯洁的AlphaGo Master的水平。 今天凌晨,谷歌旗下Deepmind人工智能团队发布了一篇轰动AI界的论文,《Mastering the game of Go without human knowledge》(在没有人类知识的情况下掌握围棋),一句话总结这篇论文,他们研发的AlphaGo大表哥AlphaGo Zero能够在没有人类围棋对弈数据的情况下,直接通过自我纯强化学习,于短短的3天自我训
镁客网
2018/05/30
8270
【Nature重磅封面】Google人工智能击败欧洲围棋冠军,3月挑战世界冠军!
围棋一直被视为人工智能最难破解的游戏。就在今天,《Nature》杂志以封面论文的形式,介绍了 Google DeepMind 开发的人工智能程序 AlphaGo,它击败了欧洲围棋冠军樊麾,并将在 3 月和世界冠军李世乭对战!Google 特地为此准备了 100 万美元奖金。 从国际象棋的经验看,1997 年人工智能第一次打败人类后,2006 年成为了人类在国际象棋的绝唱,自此之后人类没有战胜过最顶尖的人工智能国际象棋选手。在 AlphaGo 打败了欧洲围棋冠军后,世界冠军李世乭和 AlphaGo 的对弈,
新智元
2018/03/14
1.6K0
【Nature重磅封面】Google人工智能击败欧洲围棋冠军,3月挑战世界冠军!
柯洁第二局投子认负,独家专访AlphaGo开发者导师Martin Müller
机器之心原创 参与:李泽南、杜夏德 今天下午 13:37,「中国乌镇·围棋峰会」人机大战的第二场比赛落下帷幕。在耗时 3 小时 7 分钟的比赛后,柯洁投子认负,AlphaGo 取得了胜利。 在 23 日的首轮比赛中,AlphaGo 以四分之一子的优势,击败了世界第一人类围棋手柯洁。赢得比赛后,这场人机大战引起了人们广泛的关注和讨论。DeepMind 也在赛后分析解读了 AlphaGo 背后的技术,表示当前版本 AlphaGo Master 的棋力,较与李世乭对弈的 AlphaGo 版本有三子提升,就连柯洁本
机器之心
2018/05/07
6550
柯洁第二局投子认负,独家专访AlphaGo开发者导师Martin Müller
清华大学马少平:AlphaGo的成功是蒙特卡洛树搜索加深度学习的胜利
作者:马少平 清华大学计算机系教授,博士生导师,中国人工智能学会副理事长,中国中文信息学会副理事长。主要研究方向为智能信息处理,包括文本信息检索、网络用户行为分析、个性化推荐、社交媒体分析等。 在2016年3月份,正当李世石与AlphaGo进行人机大战的时候,我曾经写过一篇《人工智能的里程碑:从深蓝到AlphaGo》,自从1997年深蓝战胜卡斯帕罗夫之后,随着计算机硬件水平的提高,计算机象棋(包括国际象棋和中国象棋)水平有了很大的提高,达到了可以战胜人类最高棋手的水平。但是,长期以来,在计算机围
小莹莹
2018/04/19
1.8K0
清华大学马少平:AlphaGo的成功是蒙特卡洛树搜索加深度学习的胜利
【一文读懂AlphaGo Zero算法】白话蒙特卡洛树搜索和ResNet
【新智元导读】AlphaGo Zero 令人惊艳。不过,有些评论似乎渲染过度,把它的算法说得神乎其神。大数医达创始人,CMU计算机学院暨机器人研究所博士邓侃在本文中,尝试用大白话,通俗地解释 AlphaGo Zero,弄清楚蒙特卡洛树搜索(Monte Carlo Tree Search,MCTS)、深度学习启发函数和置信上限这三大核心概念。 AlphaGo Zero 引起巨大社会轰动 只告诉机器围棋的基本规则,但是不告诉它人类摸索了上千年才总结出来的定式等围棋战术,让机器完全依靠自学,打败人类。这个题目不
新智元
2018/03/21
2.3K0
【一文读懂AlphaGo Zero算法】白话蒙特卡洛树搜索和ResNet
再进化!通用算法 AlphaZero 再攻克几种棋又有何难
本文介绍了 AlphaZero 是如何利用深度强化学习解决围棋问题的。首先,AlphaZero 在无任何人类指导的情况下,通过自我对弈的方式学会下围棋。然后,它利用蒙特卡洛树搜索和深度神经网络来评估局面和选择策略。最后,通过与人类世界冠军和之前的围棋 AI 进行比较,AlphaZero 证明了其强大的围棋下棋能力。
企鹅号小编
2017/12/27
9390
再进化!通用算法 AlphaZero 再攻克几种棋又有何难
起底AlphaGo历史
一、AlphaGo zero横空出世 10月19日DeepMind在Nature上发表了名为Mastering the game of Go without human knowledge(不使用人类知识掌握围棋)的论文,在论文中,Deepmind展示了他们强大的新版本围棋程序“AlphaGo Zero”—— 仅经过三天训练,就能以100:0击败此前击败李世石的AlphaGo Lee,经过21天训练,就能达到击败柯洁的AlphaGo Master的水平。 论文一出,AlphaGo Zero又出名了一把,有
大数据和云计算技术
2018/03/08
1.9K0
起底AlphaGo历史
心跳之局:AlphaGo强大,柯洁伟大!
柯洁和 Google AlphaGo 的第二局棋无论从围棋角度,还是从 AI 角度,加多少感叹号都是不够的。 跟这局棋比,当湖十局、耳赤之局、镰仓十番棋都黯然失色。如果还有另一局棋比这局更值得青史留名,那没准儿会是后天柯洁主动要求执白下的对 AlphaGo 最后一局。 如果非要给这局棋加一个符合围棋史传统的名字,也许可以称之为“心跳之局”?——还记得柯洁赛后说他在紧要关头捂住心口,试图让狂跳的心脏稍稍平稳一些吗? 中午我要赶到 CSDN 开会。那时柯洁正准备随时引爆左下角的大劫。开车路上一直在想,这个
AI科技大本营
2018/04/27
6850
心跳之局:AlphaGo强大,柯洁伟大!
人类太多余?且慢,先听AI科学家详解AlphaGo Zero的伟大与局限
夏乙 李根 发自 凹非寺 量子位 报道 | 公众号 QbitAI “人类太多余了。” 面对无师自通碾压一切前辈的AlphaGo Zero,柯洁说出了这样一句话。 如果你无法理解柯洁的绝望,请先跟着量
量子位
2018/03/23
1K0
无需人类知识,DeepMind新一代围棋程序AlphaGo Zero再次登上Nature
选自DeepMind 机器之心编译 在今年五月击败柯洁之后,AlphaGo 并没有停止自己的发展。昨天,DeepMind 在《自然》杂志上发表了一篇论文,正式推出 AlphaGo Zero——人工智能围棋程序的最新版本。据称,这一版本的 AlphaGo 无需任何人类知识标注,在历时三天,数百万盘的自我对抗之后,它可以轻松地以 100 比 0 的成绩击败李世乭版本的AlphaGo。DeepMind 创始人哈萨比斯表示:「Zero 是迄今为止最强大,最具效率,最有通用性的 AlphaGo 版本——我们将见证这项
机器之心
2018/05/08
7140
无需人类知识,DeepMind新一代围棋程序AlphaGo Zero再次登上Nature
吴韧:“异构神机”强于Google AlphaGo 专注类脑芯片、调参是错误
在人工智能领域,从业者正在通过调参乃至新的芯片研发等方式追求更好的感知性能,但在知名异构智能(NovuMind)创始人&CEO吴韧看来,一些努力注定是“走偏了”,系统化的极致优化才是正确的方向,比如他的“异构神机”。 在Google DeepMind围棋人工智能系统AIphaGo对决韩国围棋第一人李世石九段之际,吴韧的团队也在筹备另一场围棋人机大战。2016年3月7日晚,在由极客帮创投、异构智能、聂卫平围棋道场联合召开的“异构智能·对弈未来”发布会上,吴韧宣布异构智能的人工智能项目“异构神机”将与世界围棋冠
用户1737318
2018/06/06
8640
李开复、马少平、周志华、田渊栋都是怎么看AlphaGo Zero的?
AI科技评论消息,北京时间10月19日凌晨,Deepmind在Nature上发布论文《Mastering the game of Go without human knowledge》(不使用人类知识掌握围棋),在这篇论文中,Deepmind展示了他们更强大的新版本围棋程序“AlphaGo Zero”,验证了即使在像围棋这样最具挑战性的领域,也可以通过纯强化学习的方法自我完善达到目的。据介绍,AlphaGo Zero仅经过三天训练,就能以100:0击败此前击败李世石的AlphaGo Lee,经过21天训练,
AI科技评论
2018/03/14
7990
李开复、马少平、周志华、田渊栋都是怎么看AlphaGo Zero的?
人工智能里程碑,谷歌AlphaGo击败围棋冠军!
围棋是众所周知的难,尽管计算机系统越来越发达,但是在强劲的围棋职业选手面前,一直都没能有重大突破。 但是,这个传统有了改变。 谷歌日前正式宣布程序AlphaGo打败了欧洲围棋职业选手,见证了人工智能的极大进步。 之前,计算机系统在智力游戏上已经取得了许多光辉的荣誉,战胜了许多人类顶级选手,包括国际象棋、五子棋、黑白棋、拼字游戏等等,但是在有着2500百年历史的东方游戏围棋上一直处在下风。 对此,谷歌的人工智能专家表示,这个壁垒很快就可以被打破了。AlphaGo在没有任何让子的情况下以5:0完胜法国围棋职业二
镁客网
2018/05/25
1.6K0
刚刚,DeepMind被IJCAI授予杰出成就奖,因为他家把AlphaGo Zero做成了暖心的新垣结衣?
啥都别说,先看图好不好 首先,恭喜DeepMind荣获大奖。 其次,获奖评语中,一定不会少的是对他家新品AlphaGo Zero的大加赞叹。 这货3天走完人类的千年棋史,这样的影响力,柯洁也坐不住了: “AlphaGo在两年内达到的成绩令人震惊。现在,AlphaGo Zero是我们最强版本,提高了计算效率,并且没有使用到任何人类围棋数据,”AI科技大本营援引AlphaGo之父、DeepMind联合创始人兼CEO 戴密斯·哈萨比斯(Demis Hassabis)的话说到,“最终,我们想要利用它的算
AI科技大本营
2018/04/28
7920
刚刚,DeepMind被IJCAI授予杰出成就奖,因为他家把AlphaGo Zero做成了暖心的新垣结衣?
推荐阅读
【柯洁战败解密】AlphaGo Master最新架构和算法,谷歌云与TPU拆解
1.5K0
AI 网红 Andrej Karpathy:为什么 AlphaGo很难应用到围棋以外的世界?
8500
AlphaGo Zero幕后开发心路历程大公开!DeepMind资深研究员黄士杰最新演讲解密
1.1K0
《自然》论文详解:AlphaGo 背后的深度神经网络和树搜索
4.3K0
深入浅出解读并思考AlphaGo
9110
现场报道 | 让天下三子,DeepMind官方解读新版AlphaGo强大实力
8020
仅用3天,AlphaGo Zero就凭借自学以100:0击败AlphaGo,柯洁表示人类太多余了
8270
【Nature重磅封面】Google人工智能击败欧洲围棋冠军,3月挑战世界冠军!
1.6K0
柯洁第二局投子认负,独家专访AlphaGo开发者导师Martin Müller
6550
清华大学马少平:AlphaGo的成功是蒙特卡洛树搜索加深度学习的胜利
1.8K0
【一文读懂AlphaGo Zero算法】白话蒙特卡洛树搜索和ResNet
2.3K0
再进化!通用算法 AlphaZero 再攻克几种棋又有何难
9390
起底AlphaGo历史
1.9K0
心跳之局:AlphaGo强大,柯洁伟大!
6850
人类太多余?且慢,先听AI科学家详解AlphaGo Zero的伟大与局限
1K0
无需人类知识,DeepMind新一代围棋程序AlphaGo Zero再次登上Nature
7140
吴韧:“异构神机”强于Google AlphaGo 专注类脑芯片、调参是错误
8640
李开复、马少平、周志华、田渊栋都是怎么看AlphaGo Zero的?
7990
人工智能里程碑,谷歌AlphaGo击败围棋冠军!
1.6K0
刚刚,DeepMind被IJCAI授予杰出成就奖,因为他家把AlphaGo Zero做成了暖心的新垣结衣?
7920
相关推荐
【柯洁战败解密】AlphaGo Master最新架构和算法,谷歌云与TPU拆解
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档