Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >阿法狗是如何工作的?卡内基梅隆大学博士用54页PPT给你答案

阿法狗是如何工作的?卡内基梅隆大学博士用54页PPT给你答案

作者头像
大数据文摘
发布于 2018-05-24 03:42:55
发布于 2018-05-24 03:42:55
7640
举报
文章被收录于专栏:大数据文摘大数据文摘

最绚烂的火花,永远产生于森然秩序被打破,天才超然于规律之外的那一瞬间

卡内基梅隆大学博士生用54页PPT解密阿法狗的工作原理

在刚刚结束的“AlphaGo”与韩国围棋高手李世石之间的人机大战第五局中,李世石执黑负,无缘两连胜。至此,人机大战五番棋全部结束,李世石1-4输掉对决,无缘100万美元赢棋奖金。

为了让大家从另外一面了解AlphaGo,Computer Science排名第一的卡内基梅隆大学的博士研究生 Shane Moon(个人主页:http://shanemoon.com/)做了一次演讲,他就读于卡内基梅隆大学著名的语言技术研究所,纯干货讲稿PPT奉上。

AlphaGo是如何工作的

演讲人:Shane Moon

2015年10月,AlphaGo与欧洲围棋冠军樊麾二段对弈

2016年3月9日-15日,AlphaGo与世界冠军李世乭九段展开对弈

电脑围棋人工智能

电脑围棋人工智能:定义

我们可以把棋盘想象成一个矩阵

当给出s,电脑围棋运算出最优移动a,得到s'

电脑围棋人工智能:一个可行的概念?

假设它模拟所有可能的棋盘落子位置呢?

进行这样的模拟直到游戏结束,然后报告输赢结果

这是不可能的,据说所有可能的棋盘排布种类总数超过了宇宙中原子的数量

关键在于:缩减搜索空间

缩减搜索空间的第一种方法:减少可选择的着法(横向缩减)

从搜索出的着法候选中把这些提前剔除

缩减搜索空间的第二种方法:提前评估落子位置(纵向缩减)

假设这里有一个函数可以计算V,即s的盘面形势评估

缩减搜索空间的两种方式:减少可选择的着法(横向),提前评估落子位置(纵向)

减少可选择的着法

得到P(下一次落子|现在的位置)

减少可选择的着法:模仿专业高手的着法(在指导下学习)

建立棋盘的预测模型

将预测模型模拟为矩阵进行运算

这个深度学习过程要经过13层“CNN”

CNN即卷积神经网络,是一种强大的图像识别任务处理模型,它将输入的图像通过卷积层抽象化

它们利用卷积神经网络模型去评估对局形势

围棋:胜利的关键在于抽象能力

卷积神经网络:抽象是其特长

模仿专业高手着法的模型

减少可选择的着法:通过自我对弈来提高(巩固学习)

两个专业高手着法模仿模型进行对弈

输赢两种结局

更新模型,不断进行新旧模型之间的对弈,最后一个版本的模型和初始版本对弈已经有了八成赢面

盘面形势评估

使用两个模型:上文最新版本的模仿模型与价值预测模型(复盘)

缩减搜索空间:横向上减少可选择的着法(策略网络),纵向上进行盘面形势评估(价值网络)

前瞻:蒙特卡洛树形研究模型

结果:AlphaGo不同成分的组合所呈现的表现

李世乭九段与AlphaGo的能量功耗对比

据估测,AlphaGo的水准在业余五段左右

将CPU/GPU资源运用到极致?

AlphaGo每天都学习数以百万计的对局

如果AlphaGo学习了李世乭的策略会怎样?谷歌表示他们不会将李世乭的比赛数据用于AlphaGo的训练数据,即使它真的学习了,仅仅与李世乭对弈几盘就修改在海量数据下训练过的模型也是很难的

AlphaGo的弱点是什么?留待研究

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2016-03-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据文摘 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
【Nature重磅封面】Google人工智能击败欧洲围棋冠军,3月挑战世界冠军!
围棋一直被视为人工智能最难破解的游戏。就在今天,《Nature》杂志以封面论文的形式,介绍了 Google DeepMind 开发的人工智能程序 AlphaGo,它击败了欧洲围棋冠军樊麾,并将在 3 月和世界冠军李世乭对战!Google 特地为此准备了 100 万美元奖金。 从国际象棋的经验看,1997 年人工智能第一次打败人类后,2006 年成为了人类在国际象棋的绝唱,自此之后人类没有战胜过最顶尖的人工智能国际象棋选手。在 AlphaGo 打败了欧洲围棋冠军后,世界冠军李世乭和 AlphaGo 的对弈,
新智元
2018/03/14
1.6K0
【Nature重磅封面】Google人工智能击败欧洲围棋冠军,3月挑战世界冠军!
为何谷歌围棋AI AlphaGo可能会把李世石击溃
/* 版权声明:可以任意转载,转载时请标明文章原始出处和作者信息 .*/ author: 张俊林 谷歌DeepMind开发的人工智能围棋程序AlphaGo以5:0的压倒性优势击败了欧洲围棋冠军、专业二段棋手Fan Hui,这是最近一周来最火爆的新闻了。16年3月份AlphaGo会和最近10年平均成绩表现最优秀的韩国九段、世界冠军李世石进行对弈,这无疑也是最吸引眼球的一场人机世纪大战,如果此役
用户1737318
2018/06/06
5630
登顶世界第一! 相比其他AI,AlphaGo究竟有何不同?
世界职业围棋排名网站GoRatings最新排名显示,连续24个月排名世界第一的中国棋手柯洁被谷歌人工智能机器人AlphaGo反超。截止目前,AlphaGo以3612分登顶世界第一,超越了所有人类棋手。
AI科技评论
2018/03/07
1K0
登顶世界第一! 相比其他AI,AlphaGo究竟有何不同?
复盘 | 离AI取代人类还有多远?
3月9日下午,经过3个半小时的激战,李世石九段投子认输,Alpha Go再次战胜人类。 根据日程安排,5局棋将分别于3月9日、10日、12日、13日和15日举行,即使一方率先取得3胜,也会下满5局。比赛采用中国规则,执黑一方贴7目半,各方用时为2小时,3次60秒的读秒。 与战前李世石预言5:0全胜的成绩相比,今天的结果有些出乎意料,也让未来几天的比赛更加充满悬念。 来个调查先: 然而,仅这一局的结果就已经能说明一些问题。 AlphaGo获胜意味着什么? 李世石战绩 1995年入段,1998年二段,1999
CDA数据分析师
2018/02/08
8990
复盘 | 离AI取代人类还有多远?
【王威廉】机器学习:现在与未来
2016年3月,在韩国首尔四季酒店举行的谷歌 DeepMind围棋挑战赛,人工智能围棋软件AlphaGo以4∶1战胜了韩国棋手李世乭九段。本次比赛后,关于人工智能和机器学习的话题迅速升温,引起社会各界的关心。然而,除了在本领域工作的一线科研人员,其他人士对人工智能和机器学习的发展现状和前景了解的却不多,甚至存在不少误解。在此,本文希望能跟读者探讨一下人工智能和机器学习,谈谈其发展现状与未来趋势。 1 什么是机器学习? 机器学习是人工智能的一个分支学科,主要研究的是让机器从过去的经历中学习经验,对数
新智元
2018/03/21
8640
【王威廉】机器学习:现在与未来
【21天完虐Master】AlphaGo Zero横空出世,DeepMind Nature论文解密不使用人类知识掌握围棋
【新智元导读】新智元AI World 2017世界人工智能大会倒计时进入20天,DeepMind 如约公布了他们最新版AlphaGo论文,也是他们最新的Nature论文,介绍了迄今最强最新的版本AlphaGo Zero,使用纯强化学习,将价值网络和策略网络整合为一个架构,3天训练后就以100比0击败了上一版本的AlphaGo。AlphaGo已经退休,但技术永存。DeepMind已经完成围棋上的概念证明,接下来就是用强化学习创造改变世界的价值。 今年5月乌镇围棋大赛时,DeepMind CEO Hassabi
新智元
2018/03/21
9780
【21天完虐Master】AlphaGo Zero横空出世,DeepMind Nature论文解密不使用人类知识掌握围棋
我是黄士杰,AlphaGo人肉臂
他面无表情,他冷静镇定,他会出现在对手的梦里,他是AlphaGo人肉臂。他热情幽默,多才多艺。他很少登台演讲。他不被允许接受采访。他是AlphaGo真正的创造者。他是Aja,黄士杰。 舒石 发自 凹非寺 量子位 报道 | 公众号 QbitAI 许峰雄绰号“CB”。 1980年,许峰雄(Feng-Hsiung Hsu)从台湾大学本科毕业,1985年考入卡内基梅隆大学。1988年,CB制造出国际象棋程序Deep Thought(深思),后来经过学弟李开复介绍,1989年加盟IBM继续展开研究。 1997年 这一
量子位
2018/03/29
1K0
DeepMind官方解密新版 AlphaGo 棋艺制胜奇招:价值网络把控通盘局面
【新智元导读】4月10日,中国棋院与谷歌在北京宣布,今年5月在“中国乌镇·围棋峰会”上AlphaGo升级版将与最顶尖的人类棋手进行对弈,世界冠军柯洁将出战。 随后,DeepMind CEO Demis Hassabis 在官方博客上撰文介绍了这一比赛和全新版的 AlphaGo,并强调 AlphaGo 不仅会下棋,在节约能源、医疗、翻译等方面也得到了应用。其团队详细也解读了AlphaGo 在围棋上的最新技术进步,包括策略和战略上的创新。 今天,中国围棋协会和浙江省体育局携手Google共同宣布,三方将联合主办
新智元
2018/03/27
7160
DeepMind官方解密新版 AlphaGo 棋艺制胜奇招:价值网络把控通盘局面
【AlphaGo2.0乌镇首局击败柯洁】人机最伟大对弈剖解,超级AI阿老师将围棋3维化
【新智元发自中国乌镇】在围棋峰会开幕式致辞中,DeepMind CEO Demis 表示,樊麾已经成为 AlphaGo 开发团队中的一位重要成员。樊麾表示,自己在与 AlphaGo 对战以后,获得了很多从未有过的认知。柯洁与 AlphaGo 对战将以全新并且激动人心的方式共同探索围棋的奥秘。Demis 还说,围棋不止是一种游戏,是一种艺术。这场比赛也不止是一场比赛,有些东西是专门设计来探索这个世界上最复杂而美丽的棋盘游戏——围棋的真理(perfection & truth),这是人类自己单独下棋再下 1 万
新智元
2018/03/28
9190
【AlphaGo2.0乌镇首局击败柯洁】人机最伟大对弈剖解,超级AI阿老师将围棋3维化
[数据分析]AlphaGo眼中的李世乭&李世乭最后的机会
作 者:Heinrich 知 乎:Heinrich 微 博:@花生油工人 知乎专栏:与时间无关的故事 本文已获得作者授权 推荐语:此文写于AlphaGo与李世乭大赛的第二局结束后,作者对双方水平及棋局的走向预测都很准确,不过相对于结果,分析过程更值得学习 用自己的DCNN把李世乭过去曾下的295盘棋,30366步分析了一下,然后再过去的两局中验证了一下,得到很多有意思的数据。因为我的围棋水平实在太差,所以把所有提取的数据发上来跟大家分享一下,供围棋高手们分析,欢迎批评指正。 第一部分 AlphaGo眼中的
大数据文摘
2018/05/24
6760
AlphaGo再下一城,是否代表已经诞生了真正的智能?
在刚刚结束的围棋人机第二场比赛中,AlphaGo执黑再下一城,原来对李世石抱有很大期望的围棋界人士信心受到重创,同样作为职业九段的选手,柯洁甚至在第二场比赛未结束时就表示,现在只希望李世石赢一场扳回面
机器人网
2018/04/23
5560
AlphaGo再下一城,是否代表已经诞生了真正的智能?
人机围棋大战首局落定,阿尔法狗是怎么赢的?
今天下午谷歌人工智能AlphaGo与韩国棋手李世石的第一场比赛结束,AlphaGo获得今日比赛的胜利。双方在较量3个半小时后,李世石宣布认输。今日比赛结束后,双方还将分别在3月10日(周四)、12日(周六)、13日(周日)、15日 (周二)的北京时间中午12点进行剩余4场比赛。 本次比赛用时每方2小时,1分钟读秒三次。比赛采用中国规则,黑贴3又3/4子(黑贴7目半)。采用中国规则是因Alpha GO以中国规则为基础开发。 比赛采用5局3胜制,最终比赛获胜方将获得奖金100万美元。如果AlphaGo获胜,奖金
机器人网
2018/04/23
1.2K0
人机围棋大战首局落定,阿尔法狗是怎么赢的?
洞察|AlphaGo之父揭开打败柯洁的秘密:强AI是人类的终极工具
5月24日,在新版本AlphaGo首战以1/4子微弱优势战胜中国围棋职业九段棋手柯洁之后,“AlphaGo之父”DeepMind创始人兼CEO Demis Hassabis、AlphaGo团队负责人David Silver在人工智能高峰论坛上详解了AlphaGo的研发并就“AlphaGo意味着什么?”的问题进行了详细解答。 “AlphaGo已经展示出了创造力,也已经可以模仿人类直觉了。在过去一年,我们继续打造AlphaGo,我们想打造完美的AlphaGo,弥补它知识方面的空白。因为在与李世石的比赛中,它
灯塔大数据
2018/04/08
6410
洞察|AlphaGo之父揭开打败柯洁的秘密:强AI是人类的终极工具
围棋人机大战一周年:被AlphaGo改变的世界
舒石、若朴 发自 凹非寺 量子位·QbitAI 报道 去年今日,三连败的李世乭扳回一局。 然而这一针兴奋剂很快失效,随后李世乭再折一阵,最终以1:4输给AlphaGo。在围棋的人机大战中,顶级人类选手完败给人工智能。 人工智能一战成名,李世乭留下落寞侧影。为AlphaGo落子的黄士杰一年后回忆说:“当时我代表AlphaGo下棋,必须保持冷静”。 从那时起到现在,人类始终生活在一个被AlphaGo改变的世界。 一年回望 站在围棋人机大战一周年的节点上,该如何回顾过去、展望未来
量子位
2018/03/22
7200
围棋人机大战一周年:被AlphaGo改变的世界
AlphaGo 是如何把 CNN 接到搜索的?
AlgorithmDog
2018/01/08
2.3K0
AlphaGo 是如何把 CNN 接到搜索的?
2:0!柯洁次战中盘告负AlphaGo,表现一度完美
唐旭 若朴 发自 东瑶村 量子位 报道 | 公众号 QbitAI 鏖战155手,柯洁二战AlphaGo再次落败。中盘告负。 这场比赛的激烈和复杂程度,超越双方的首场对决。中盘阶段,根据AlphaGo的
量子位
2018/03/30
7450
现在的谷歌AlphaGo想挑战顶级选手会成功吗?
最近被不断刷屏的就是谷歌的AI战胜了欧洲围棋冠军。很多人都在猜想,这是不是就代表人工智能在与人类的对战当中,已经在慢慢获得成功,连最难的围棋现在都已经攻克了职业选手,那么战胜世界冠军也不是不可能的事,况且已经决定于3月份对战九段顶级选手李世石。可见人类与AI之间的防护墙正在慢慢坍塌。 这次谷歌使用的人工智能软件叫做AlphaGo,由去年收购的人工智能公司DeepMind所研发,起到关键作用的就是两个神经网络,一是决策网络,负责下一步走法;另一个是叫值网络,主要是可以预测不同的分布可能会带来什么的后果。 此次
镁客网
2018/05/25
5300
从"深蓝"到 AlphaGo丨AI 在游戏领域的升级打怪之路
可以说,AI的发展进化史就是AI在游戏领域的升级史。 SciShow是Youtube上热门的科普向脱口秀节目。它的内容包罗万象,无论什么问题在这里都会得到风趣又详尽的解答。在本次节目中,介绍了AI 是
CDA数据分析师
2018/02/08
1.4K0
从"深蓝"到 AlphaGo丨AI 在游戏领域的升级打怪之路
围棋天团告负!1v5英雄“狗”背后的原理概括
今天,中国围棋峰会进行到了第四天,AlphaGo挑战两种未曾体验过的比赛:人机配对赛和1v5的团体赛。 对于全新的比赛形式,棋圣聂卫平与AlphaGo之父哈萨比斯谈了这样的问题:如果让柯洁与AlphaGo搭档,对阵另外一台AlphaGo,究竟哪一方更厉害?参与人机配对赛的古力九段,则在赛前表示:要努力配合好AlphaGo才能有希望。 不幸的是,配对赛战到中局,跟古力合作的AlphaGo不愿再配合他,径直就要投降……但古力被逆转得实在不甘,断然拒绝投降。于是,赢棋无望AlphaGo开始乱走,不到8手棋,古
AI科技大本营
2018/04/27
1.1K0
围棋天团告负!1v5英雄“狗”背后的原理概括
专栏 | 阿尔伯塔大学李玉喜博士:我们应该如何面对强大的计算机围棋AlphaGo?
机器之心专栏 作者:李玉喜 AlphaGo 与世界第一的人类棋手柯洁的对弈比赛已经引起了全世界的广泛关注。不出意外,尽管柯洁表现出色,但 AlphaGo 仍然连续取得了两场胜利。明天柯洁还将与 AlphaGo 展开最后一场比赛,是否会出现意外惊喜,让我们拭目以待。最后的比赛之前,加拿大阿尔伯塔大学计算机系博士、博士后李玉喜撰写了一篇解读 AlphaGo 背后的技术以及讨论我们应该如何应对这些技术的文章。李玉喜博士致力于深度学习、强化学习、机器学习、人工智能等前沿技术及其应用。曾任电子科技大学副教授;在美国
机器之心
2018/05/07
1.2K0
专栏 | 阿尔伯塔大学李玉喜博士:我们应该如何面对强大的计算机围棋AlphaGo?
推荐阅读
相关推荐
【Nature重磅封面】Google人工智能击败欧洲围棋冠军,3月挑战世界冠军!
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档