Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >深度学习真的不需要理论指导了?图灵奖得主讲座无人问津,贝叶斯之父Judea Pearl落寞身影背后引人深思

深度学习真的不需要理论指导了?图灵奖得主讲座无人问津,贝叶斯之父Judea Pearl落寞身影背后引人深思

作者头像
企鹅号小编
发布于 2018-01-08 11:39:12
发布于 2018-01-08 11:39:12
1.3K0
举报
文章被收录于专栏:企鹅号快讯企鹅号快讯

【导读】最近NIPS 2017 "Test of Time"论文大奖获得者Ali Rahimi 在长滩现场的演讲中把机器学习称为“炼金术”(Alchemy)引起机器学习界的大讨论,不难理解深度学习理论的研究似乎真的陷入了尴尬的境地。与此同时,寂寞的背影,听者寥寥的会场,图灵奖得主同时也是贝叶斯之父 Judea Pearl 的报告似乎并没多少人关心。而报告的题目《机器学习的理论障碍》(Theoretical impediments to machine learning)正是关于Judea Pearl对机器学习特别是深度学习背后理论的思考。

NIPS 2017 "Test of Time"论文大奖获得者Ali Rahimi 在长滩现场的演讲中抱怨当前机器学习尤其是深度学习使用的很多方法缺少(理论)理解。而Lecun则回怼说:仅仅因为理论没有追赶上实践的水平,就批评整个机器学习社区使用「炼金术」,这种言论是危险的。

CMU大学教授,Petuum公司创始人Eric Xing则在看到这组图后表示:这是NIPS2017大会上一个让人难过的场景。成为一个单纯的“炼金术师”并不可耻,可耻的是并不努力从“炼金术师”学成“化学家”。 意思是仅仅反复的做工程实践并没有什么不对的,但是还应该想想背后的原理。(不想当将军的士兵不是好兵?)

图是Judea Pearl演讲的会场

▌Judea Pearl简介

Judea Pearl 曾获得2011年的图灵奖,奖励他在人工智能领域的基础性贡献,他提出概率和因果性推理演算法,彻底改变了人工智能最初基于规则和逻辑的方向。他主要的研究领域是概率图模型和因果推理,这是机器学习的基础问题。图灵奖通常颁给纯理论计算机学者,或者早期建立计算机架构或框架的学者。

Judea Pearl 是 UCLA 计算机科学系的教授,他曾两次居于科学革命的中心:第一次是在 20 世纪 80 年代,他为人工智能引入了一套新的工具,叫贝叶斯网络。这种基于概率的机器推理模型使得机器能在复杂的、模糊的和不确定性的环境下工作。短短几年内,贝叶斯网络就完全替代了此前基于规则的人工智能方法。

第二次革命,鉴于贝叶斯网络在计算上的优势,Pearl 意识到简单的图模型和概率论(正如贝叶斯网络中的那样)也能用于因果关系的推理。这一发现为人工智能的发展奠定了另一个基础,但意义远非如此,这一能验证因果关系的、条理性的数学方法,几乎已经被所有科学和社会科学领域采用。

Judea Pearl 还是一名美国国家工程院院士,也是 AAAI 和 IEEE 的资深会员,是以他儿子姓名命名的 Daniel Pearl 基金会的主席(他的儿子Daniel Pearl曾是华尔街日报记者,2002年被巴基斯坦恐怖份子绑架并斩首,为这事美国还专门拍了一部电影 ” A Mighty Heart” 。)

场外JudeaPearl亲自讲解自己的工作

http://web.cs.ucla.edu/~kaoru/theoretical-impediments.pdf

▌理论在深度学习中的作用

AliRahimi 阿里引起的理论之争一石激起千层浪,网络上出现了更多机器学习界的代表发声。今天芝加哥丰田研究院教授DavidMcAllester发表博文进行解读,以下内容为McAllester的观点:

这篇博文的主要受Ali Rahimi最近的NIPS演讲和Lecun回怼的启发。

https://www.reddit.com/r/MachineLearning/comments/7hys85/nalirahimistalkatnipsnips2017testoftime/

https://www.facebook.com/search/str/yann+lecun+alchemy/keywordssearch

这个研究话题从根本上就是理论和深度学习的关系。我将从Ali的演讲中摘抄一些引用。

Rahimi

机器学习已经成为炼金术。

炼金术是有效的(对于很多事情)。

但科学家已推翻二千年的炼金术的理论。

我想生活在一个社会,这个社会的制度建立在可证实的严谨的知识上,而不是炼金术上。

LeCunn

理解(理论或其他)是一件好事。但是仅仅因为理论没有追赶上实践的水平,就批评整个机器学习社区使用「炼金术」,这种言论是危险的。

为什么危险?正是这种态度使机器学习社区放弃神经网络 10 年有余,尽管大量实证研究证明神经网络在很多情况下非常有效。

我从根本上同意Yann的观点,他认为苛刻的要求会误导一个领域。也许最危险的是要用成熟的数学理论来打动同行,而不是寻求真正的进步。

但我想在这场辩论中加入我自己的观点。我将再次引用Rahini:

Rahini:

当一个深度网络不起作用时,我认为它是梯度下降的错误。

梯度下降是深度学习的基石。梯度下降是局部搜索的一种形式。以下是一些局部搜索的例子:

内燃机从十九世纪九十年代到二十世纪的演变。

摩尔定律指导下近50年来半导体工艺的发展。

包括人类大脑进化的生物进化。

从希腊数学到现代数学的演变。

Alphago zero训练时间,通过自我下棋成为世界上最强大的国际象棋程序。

局部搜索确实是神秘的。但是,我们真的能期待一个严格的局部搜索理论来预测或解释人脑的进化或数学知识的历史演变吗?我们真的可以期待通过某种梯度下降的二阶分析来预测未来二十年将出现哪些数学理论?我的立场是,局部搜索(梯度下降)是非常强大的,从根本上超出了任何完全严格的理解。

如今的计算能力已经达到了这样的水平:强大GPU加上强大架构设计上的梯度下降只能被理解为某种形式的非常强大的通用非凸局部搜索,其性质类似于上述例子。是的,特定的神经网络训练失败是梯度下降(局部搜索)的失败。但是那个观察提供提供的信息很少。

一个相关的问题是在通用人工智能(AGI)中时间帧上的方位。严谨是否有助于实现AGI? 也许即使是Rahini也会发现对AGI的严格处理是不可能的。一个严谨者的普遍反应是,AGI太远太扯淡。但是,我觉得我们离得很近,这更让人兴奋。

我写了一篇关于关于近期的机器感知的合理性的博客文章(https://machinethoughts.wordpress.com/2017/07/22/the-plausibility-of-near-term-machine-sentience/)。

我相信洞察结构是可能的,而这种洞察可以成功地指导设计。LSTMs出现在1997年,因为有克服梯度小时的一种“理论洞察力”。理解批量标准化是克服内部协变量转换的一种方法,我确实认为我是在直观的层面来理解(我很乐意解释它)。直觉的非严格的理解是理论理解的基础。

20多年前,Fernando Pereira(可能他是引用别人)对我说“探险家”和“定居者”。探险者首先看到地形(没有严谨),定居者清理它(严谨)。考虑微积分或傅立叶分析。但在局部搜索的情况下,我不认为定理(定居者)将会解决它。

在我看来,一般局部搜索(AGI)的进展将来自寻找正确的计算模型——正确的通用架构——用于定义“强”局部搜索空间的结构。我已经写了一篇关于搜索一般认知架构的博文(https://machinethoughts.wordpress.com/2016/06/20/cognitive-architectures/)。

输或赢,我个人打算继续追求AGI。

参考文献:

https://machinethoughts.wordpress.com/2017/12/08/the-role-of-theory-in-deep-learning/

本文来自企鹅号 - 专知媒体

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文来自企鹅号 - 专知媒体

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
【2018深度学习10大警示】多数芯片公司将破产;自我对弈可自动创造知识
来源:Medium 编辑:Cecilia 【新智元导读】2018年,对于深度学习来说,将是剧变的一年。多数硬件公司将破产;元学习将成为新随机梯度下降法;直觉机器将弥合语义差异;深度学习研究将愈发泛滥等十大趋势值得注意。 2018年,对于深度学习来说,将是剧变的一年。2017年深度学习的许多突破将在2018年继续强势推进。许多研究将成为日常应用。以下是对2018年深度学习的十个警示性预测。 多数深度学习硬件初创公司将失败 许多深度学习硬件初创企业将在2018年开始交付芯片。很多公司都将失败,因为他们并未提供良
新智元
2018/03/20
6860
NIPS风波 | 获奖者登台开炮:ML是炼金术,大神LeCun强硬回怼
夏乙 问耕 发自 凹非寺 量子位 出品 | 公众号 QbitAI 谁能想到,NIPS这种顶会都能风波乍起。 Ali Rahimi(阿里·拉希米),因为2007年发表的一篇论文,获得今年的“Test o
量子位
2018/03/23
6410
NIPS风波 | 获奖者登台开炮:ML是炼金术,大神LeCun强硬回怼
观点 | 如何优雅地从四个方面加深对深度学习的理解
2017 年 12 月 NIPS 的 Test-of-Time Award 颁奖典礼上,Ali Rahimi 这样呼吁人们加深对深度学习的理解:
机器之心
2018/09/20
6740
观点 | 如何优雅地从四个方面加深对深度学习的理解
NIPS机器学习炼金术之争,Twitter机器学习研究员参战
本文探讨了机器学习中一种被称为“炼金术”的现象,以及它如何影响机器学习的发展。作者认为,机器学习中的“炼金术”过于关注数据集和实证结果,而忽略了理论、模型和算法等方面的深入探讨。作者认为,在机器学习的发展过程中,应该更加关注理论、模型和算法等层面的研究,这样才能更好地推动机器学习的发展。"
企鹅号小编
2017/12/28
6120
NIPS机器学习炼金术之争,Twitter机器学习研究员参战
图灵奖得主、贝叶斯之父 Judea Pearl 谈深度学习局限,想造自由意志机器人
【新智元导读】人工智能领域最高荣誉图灵奖的获得者,贝叶斯之父 Judea Pearl 日前接受 Edge 的采访。他谈到自己发明贝叶斯理论的过程,谈到了当下火热的深度学习的几个局限,也说到了自己的研究兴趣:希望开发拥有自由意志的机器人。他认为,决策理论也许是创造出人类智慧的一个方式。 文章要点 20世纪80年代,当我们从基于规则的系统过渡到贝叶斯网络的时候,产生了一种新的思想。贝叶斯网络是一种概率推理系统。专家可以把自己对所在领域的专业知识输入其中。领域可以指疾病或者石油,这和专家系统的目标是一致的。 这
新智元
2018/03/26
1K0
观点 | NIPS 2017经典论文奖获得者机器学习「炼金术」说引热议,LeCun发起反驳
机器之心报道 参与:路雪、刘晓坤、李泽南 去年的 NIPS 曾因 GAN 引发了一场风波,而今年的 NIPS 同样有着不同思想的碰撞,而这场机器学习「炼金术」讨论竟是从大会颁奖典礼上开始的。 谷歌研究
机器之心
2018/05/09
8840
薛定谔的佛与深度学习中的因果
作者:王庆法,中国东信CTO 【新智元导读】最近流行佛系XXX,殊不知深度学习里也有佛。本文是继《薛定谔的滚与深度学习中的物理》一文后,笔者又一心力之作。从神秘的钟型曲线,到贝叶斯推理应用于神经网络,再到深度学习的因果推理,带大家来一场从统计到因果的认知修行。 《寻梦环游记》看哭了许多人,小男孩米格踏过花瓣桥,也就踏入了既生又死的状态,出现在他眼前的,是恢弘的亡灵世界。如果人世间没有人再记得,骷髅人也将在亡灵世界烟消云散,这是人存在的本来景象吗?玛雅人祭奠的圣井,真的是通往亡灵世界的入口吗?玛雅人是不是已然
新智元
2018/03/20
1.1K0
薛定谔的佛与深度学习中的因果
深度学习理论在哪里?再思考- 中科院自动化所胡包钢研究员参加2017年NIPS会议感想
【导读】本文原本是为《基于信息理论的机器学习》教程中文注释后记准备的。但是上周我参加NIPS学术会议期间曾受《专知》邀请建议回来后写些会议感言。为简单将这感言与后记内容融合在一起。因为两件事情内容是相
WZEARW
2018/04/11
9200
深度学习理论在哪里?再思考- 中科院自动化所胡包钢研究员参加2017年NIPS会议感想
图灵奖得主Judea Pearl谈机器学习:不能只靠数据
选自Journal of Causal Inference 作者:Judea Pearl 机器之心编译 编辑:Panda 研究机器学习,既要数据拟合,也要能解释数据。 在当前的人工智能研究社区,以数据为中心的方法占据了绝对的主导地位,并且这类方法也确实成就非凡,为语音识别、计算机视觉和自然语言处理等重要任务都带来了突破性的进展。即便如此,也一直有研究者在思考这类方法的不足之处以及其它方法的重要价值。近日,图灵奖获得者、著名计算机科学家和哲学家 Judea Pearl 发布了一篇短论文,从便利性、透明度
机器之心
2023/03/29
2240
图灵奖得主Judea Pearl谈机器学习:不能只靠数据
谷歌研究员再批:机器学习慢慢变成新时代的炼金术
---- 新智元报道 来源:sciencemag.org 编辑:肖琴 【新智元导读】最近,谷歌的AI研究人员、 "Test of Time Award"得主Ali Rahimi指出,计算机通过尝试错误法(trial and error)进行学习的机器学习算法已经成为“炼金术”的一种形式。Rahimi说,如果不深入了解构建和训练新算法所需的基本工具,研究人员就会像中世纪的炼金术士一样用道听途说的方法来研究人工智能。 去年在NIPS会议上,谷歌的AI研究人员、 "Test of Time Award"得
新智元
2018/05/29
6240
【CNN已老,GNN来了】DeepMind、谷歌大脑、MIT等27位作者重磅论文,图网络让深度学习也能因果推理
新智元报道 来源:Arxiv; Quanta Magazine等 编辑:闻菲,刘小芹 【新智元导读】DeepMind联合谷歌大脑、MIT等机构27位作者发表重磅论文,提出“图网络”(Graph n
新智元
2018/06/22
1.1K0
赢家诅咒+经验主义?刚刚结束的ICLR上,谷歌研究员再批当前AI炼金术通病
大数据文摘作品 编译:冯琛、Aileen 在刚过去的ICLR会议中,谷歌人工智能研究员Ali Rahimi批评了整个机器学习行业对经验法则、试错法和迷信的过分依赖。 去年12月,谷歌公司的人工智能(AI)研究员Ali Rahimi在NIPS大会的演讲中批判了自己的研究领域,他说,计算机通过尝试和错误进行学习的机器学习算法已经成为“炼金术”的一种。 研究人员其实并不知道为什么某些算法行之有效,而其他算法徒劳无益,他们也没有严格的标准来界定AI架构的选择。因此,他获得了现场观众长达40秒的欢呼。 4月30日,
大数据文摘
2018/05/23
3640
再谈“炼金术”:可以使用不严谨的方法,但拒绝不严谨的评估方法
原作:inFERENCe 安妮 编译自 inference.vc 量子位 出品 | 公众号 QbitAI 昨天,NIPS大会中“Test of Time”最具时间价值大奖的获得者Ali Rahimi(阿里·拉希米)在演讲时表示,机器学习已经成为了炼金术。此话一出,就引发了大量讨论。 在Reddit上这个话题同样火爆,剑桥大学博士Ferenc Huszár在他的博客inFERENCe阐述了自己的观点,获得了很多人的支持。 他到底说了什么?他怎么看? 像大家一样,我很欣赏阿里在NIPS上的演讲,并且推荐所有人都
量子位
2018/03/23
5190
再谈“炼金术”:可以使用不严谨的方法,但拒绝不严谨的评估方法
学界 | 我们还缺多少基础理论,才能在高中开设深度学习课程?
AI 科技评论按:这篇文章来自资深机器学习专家、NIPS 2017 「时间检验奖」( Test of Time Award ) 获得者 Ali Rahimi。上一次 Ali 在获奖演讲中把深度学习比作炼金术引起了深度学习界的大规模的讨论,Yann LeCun 也和他掐了起来,但最终大家都认可深度学习的理论基础还不够扎实。另一方面,深度学习热度不减,不仅各个知名大学的相关硕士博士申请火爆,甚至本科和高中阶段都有学校开始考虑设置机器学习/人工智能课程,其中当然也少不了身处潮头浪尖的深度学习。
AI科技评论
2018/07/26
2400
学界 | 我们还缺多少基础理论,才能在高中开设深度学习课程?
Tomaso Poggio:深度学习需要从炼金术走向化学
记者 | 周翔 AI科技大本营1月28日消息,《麻省理工科技评论》新兴科技峰会EmTech China在北京召开,营长也受邀参加,会上有多位人工智能领域的重磅大佬出没,Tomoso Poggio 教授就是其中一位。 说起 Tomoso Poggio ,也许很多人不太熟悉,但他的几个学生都已经名满天下。比如:DeepMind 创始人、Alpha Go 之父 Demis Hassabis;艾伦人工智能研究所首席科学家 Christof Koch;Mobileye 创始人兼 CTO Amnon Shashua
AI科技大本营
2018/04/26
6950
Tomaso Poggio:深度学习需要从炼金术走向化学
图灵奖得主Judea Pearl谈机器学习:不能只靠数据
来源:机器之心 本文约3000字,建议阅读6分钟 研究机器学习,既要数据拟合,也要能解释数据。 在当前的人工智能研究社区,以数据为中心的方法占据了绝对的主导地位,并且这类方法也确实成就非凡,为语音识别、计算机视觉和自然语言处理等重要任务都带来了突破性的进展。即便如此,也一直有研究者在思考这类方法的不足之处以及其它方法的重要价值。近日,图灵奖获得者、著名计算机科学家和哲学家 Judea Pearl 发布了一篇短论文,从便利性、透明度、可解释性三个角度谈了他对激进经验主义和机器学习研究的思考。 论文链接:
数据派THU
2023/03/29
2040
图灵奖得主Judea Pearl谈机器学习:不能只靠数据
独家 | 如何解决深度学习泛化理论
作者:Dmytrii S. 翻译:陈之炎 校对:卢苗苗 本文与大家讨论深度学习泛化理论中的一些经验并试图对它做出解释。 我们可以从最新的关于深度学习“炼金术”的悖论研究中了解一二。 动机 深度学习目前正被用于方方面面。但是,人们经常批评它缺乏一个基础理论,能够完全解释其为什么能如此神奇。最近,神经信息处理系统大会(NIPS)的时间测试奖(Test-of-Time)得主将深度学习比作“炼金术”。 尽管解释深度学习泛化理论仍然是一个悬而未决的问题,在这篇文章中,我们将讨论这个领域最新的理论和先进的经验,并试
数据派THU
2018/03/20
1.1K0
独家 | 如何解决深度学习泛化理论
深度学习的光环背后,都有哪些机器学习的新进展被忽视了?
从神经网络被学术界排挤,到计算机科学界三句话不离人工智能、各种建模和预测任务被深度学习大包大揽,只不过短短十年时间。这十年里我们目睹了 dropout、SGD+动量、残差连接、预训练等等深度学习技术的大爆发,见证了学术研究全面拥抱深度学习,也听到了对深度学习不足之处的质疑之声、感受到了很多人对非深度学习方法「复兴」的期盼。
AI研习社
2020/02/21
7180
图灵奖得主Geoffrey Hinton:我的五十年深度学习生涯与研究心法
---- 新智元报道   来源:数据派THU 机器学习初学者 作者:王菁 林亦霖 沈佳丽 程浩源 许菡如 胡燕君 贾川 编辑:好困 【新智元导读】本文介绍了Hinton非常坦诚地分享了自己的学术生涯,深度学习的未来和研究心得。 他从未正式上过计算机课程,本科在剑桥大学读的是生理学和物理学,期间曾转向哲学,但最终拿到的却是心理学方向的学士学位;他曾因为一度厌学去做木匠,但遇挫后还是回到爱丁堡大学,并拿到「冷门专业」人工智能方向的博士学位;数学不好让他在做研究时倍感绝望,当了教授之后,对于不懂的神经科学和
新智元
2023/04/04
5020
图灵奖得主Geoffrey Hinton:我的五十年深度学习生涯与研究心法
2017年机器学习几大主要进展汇总!
摘要: 2017年注定是机器学习快速发展的一年,特别是机器学习商业化的成功是的更多的人积极的投入到机器学习的学习当中。机器学习一定会成为未来的技术,让我们看看这项未来的技术现在发展到何种程度。 很难
IT派
2018/03/28
9380
2017年机器学习几大主要进展汇总!
推荐阅读
【2018深度学习10大警示】多数芯片公司将破产;自我对弈可自动创造知识
6860
NIPS风波 | 获奖者登台开炮:ML是炼金术,大神LeCun强硬回怼
6410
观点 | 如何优雅地从四个方面加深对深度学习的理解
6740
NIPS机器学习炼金术之争,Twitter机器学习研究员参战
6120
图灵奖得主、贝叶斯之父 Judea Pearl 谈深度学习局限,想造自由意志机器人
1K0
观点 | NIPS 2017经典论文奖获得者机器学习「炼金术」说引热议,LeCun发起反驳
8840
薛定谔的佛与深度学习中的因果
1.1K0
深度学习理论在哪里?再思考- 中科院自动化所胡包钢研究员参加2017年NIPS会议感想
9200
图灵奖得主Judea Pearl谈机器学习:不能只靠数据
2240
谷歌研究员再批:机器学习慢慢变成新时代的炼金术
6240
【CNN已老,GNN来了】DeepMind、谷歌大脑、MIT等27位作者重磅论文,图网络让深度学习也能因果推理
1.1K0
赢家诅咒+经验主义?刚刚结束的ICLR上,谷歌研究员再批当前AI炼金术通病
3640
再谈“炼金术”:可以使用不严谨的方法,但拒绝不严谨的评估方法
5190
学界 | 我们还缺多少基础理论,才能在高中开设深度学习课程?
2400
Tomaso Poggio:深度学习需要从炼金术走向化学
6950
图灵奖得主Judea Pearl谈机器学习:不能只靠数据
2040
独家 | 如何解决深度学习泛化理论
1.1K0
深度学习的光环背后,都有哪些机器学习的新进展被忽视了?
7180
图灵奖得主Geoffrey Hinton:我的五十年深度学习生涯与研究心法
5020
2017年机器学习几大主要进展汇总!
9380
相关推荐
【2018深度学习10大警示】多数芯片公司将破产;自我对弈可自动创造知识
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档