前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >LSTM之父粉丝猛怼 Hinton:五篇主要深度学习论文未引用Jürgen早期工作!

LSTM之父粉丝猛怼 Hinton:五篇主要深度学习论文未引用Jürgen早期工作!

作者头像
新智元
发布于 2019-12-03 10:42:15
发布于 2019-12-03 10:42:15
7740
举报
文章被收录于专栏:新智元新智元
新智元报道

来源:Reddit

编辑:小芹、鹏飞

【新智元导读】Reddit有人爆料,深度学习大神Hinton的五篇主要深度学习论文都没有引用Jürgen Schmidhuber早期的相关工作。Jürgen是LSTM之父、著名深度学习专家,然而其知名度远不及“深度学习三巨头”,再次引起业界热议。你怎么看?来新智元AI朋友圈 和AI大咖们一起讨论吧。

今天,一篇帖子打破了Reddit机器学习板块的平静:Geoff Hinton的五篇主要深度学习论文都没有引用Jürgen Schmidhuber早期的相关工作

Jürgen Schmidhuber是LSTM 的发明人、著名深度学习专家。事情缘起于Jürgen上个月发表的一篇长文《Deep Learning: Our Miraculous Year 1990-1991》,他详细论述了近30年前,即1990~1991年之间他和团队进行的许多研究,并称这一年为“奇迹之年”。

新智元对这篇文章进行了翻译介绍,请参考:

世界欠他一个图灵奖!LSTM之父的深度学习“奇迹之年”

帖主自称是Jürgen“真正的粉丝”,他提到Jürgen的“奇迹之年”文章,指出:请看第1、2、8、9、10节,Jürgen提到了他们在Hinton之前很久做的工作,但Hinton都没有引用,这些研究的参考文献证实了这一点,乍一看,它并不明显,是隐藏的,必须要从参考文献中回溯才能发现。

帖主一一列举:

在“第1节,第一个非常深的神经网络,基于无监督预训练 (1991)”Jürgen“通过对RNN的层次结构进行无监督的预训练,促进了深度RNN的有监督的学习”,并且很快就能够“解决以前无法解决的深度学习任务,神经网络的层数超过了 1000 层”,他提到参考文献[UN4],实际上是Hinton后来的类似工作:

这项工作发表十多年后,一种用于更有限的前馈神经网络的类似方法出现了,称为深度置信网络 (DBN)。该论文的证明基本上就是我在 1990 年代早期为我的 RNN 堆栈使用的证明:每一个更高的层都试图减少下面层中数据表示的描述长度 (或负对数概率)。

在那个时候,无监督的预训练是一件大事,而现在已经不那么重要了。请参阅第19节“从无监督预训练到纯粹监督学习 (1991-95 和 2006-11)”

在“第 2 节:将神经网络压缩 / 蒸馏成另一个 (1991)”,Jürgen还训练了“一个学生NN来模仿教师NN的行为”,简要提到了Geoff后来的类似工作[DIST2]:

我称之为将一个网络的行为 “collapsing” 或 “compressing” 到另一个。今天,这个概念已经被广泛使用,也被称为将教师网络的行为 “蒸馏”(distilling) 或 “克隆” 到学生网络。

在“第 9 节:通过神经网络学习序列注意力 (1990)”,Jürgen写道:我们已经有了两种现在常见的神经序列注意力类型:通过神经网络中的乘法单元来实现端到端可微分的 “软” 注意力,以及在强化学习环境下的 “硬” 注意力。博客上提到后来的大量后续工作都基于此,包括Hinton类似工作[ATT3]:

我在CMSS 1990 [ATT2]上发表的概述论文总结了我们有关注意力的早期工作,据我所知,这是第一个已实现的神经系统,用于结合glimpses,共同训练识别和预测组件与注意力组件。二十年后,我1990年论文的审稿人写了他自己作为相关论文[ATT3]:“据我们所知,这是第一个将glimpses结合在一起的可实现系统,共同训练识别组件…注意力组件。”

与第10节“分层强化学习 (1990)”类似,Jürgen介绍了HRL“使用端到端可微的基于NN的子目标生成器HRL0,以及使用循环的NN学习生成子目标序列[HRL1] [HRL2]”,提到了Hinton后期的工作HRL3:

不久之后,其他人也开始发表HRL的文章。例如,我们参考文献[ATT2]的审稿人是参考文献 [HRL3]的作者(该审稿人在第6节中总结了我们关于HRL的早期工作)。

第 8 节:端到端可微快速权重:让神经网络学习编程神经网络 (1991)”中,Jürgen发布了一个网络“通过梯度下降学习以快速操作另一个网络的快速权重存储”,和“主动控制快速的权重通过二维张量或外部产品更新权重”,指向的[FAST4a]论文恰好是Hinton后来的论文:

四分之一个世纪后,其他人也采用了这种方法[FAST4a]

帖主总结道:

确实,Hinton并没有在任何类似的论文中引用Jürgen,更有点疯狂的是,他是Jürgen 1990年的论文[ATT2]的编辑,该论文总结了注意力学习和分层RL,之后他发表了相关的论文,但是他没有引用Jürgen。

Jürgen还有一个著名的抱怨,即Hinton在《自然》杂志上发表的深度学习综述既没有提到反向传播的发明者(1960-1970),也没有提到“深度学习之父Alexey Grigorevich Ivakhnenko”,后者在1965年发表了首个适用于深度网络的通用学习算法。

除了Ivaknenko和Fukushima等六七十年代早期的先行者外,大多数深度学习的概念都来自于Jürgen与Sepp、 Alex和Dan等人的团队:深度网络的无监督预训练,人工好奇心和GAN,梯度消失,语言处理和语音的LSTM,蒸馏网络,注意力学习,赢得视觉比赛的CUDA CNN, 100层以上的深度网络,meta-learning,以及optimal AGI和Godel Machine的理论工作。

Jürgen 表示,深度学习革命背后的许多基本思想,是在 1990~1991 年不到 12 个月的时间里,在慕尼黑理工大学 (TU Munich) 产生的,而这些思想为当今的许多深度学习前沿研究奠定了基础,包括 LSTM、元学习、注意力机制和强化学习等。

Jürgen 称这一年为 “奇迹之年”。尽管当时他们发表的工作几乎无人问津,但四分之一个世纪后,基于这些想法的神经网络不断得到改进,其应用出现在智能手机等 30 多亿设备、每天被使用数十亿次,在全世界消耗大量的计算资源。

在 AI 领域,深度学习三巨头 Geoffrey Hinton、Yoshua Bengio 和 Yann LeCun 人尽皆知,Jürgen Schmidhuber 的知名度却远不及三人,尽管他发明的 LSTM 被认为是教科书级别的贡献。他是被图灵奖遗忘的大神。在Hinton等三巨头获图灵奖之时,Jürgen却得到了很大的呼声:“为什么Jürgen没有得图灵奖?”

除了 LSTM 之外,Jürgen Schmidhuber “引以为傲” 的还有他在 1992 年提出的 PM(Predictability Minimization)模型。他坚持认为现在大火的 GAN 就是 PM 的变种,两者的区别就在于方向是反的,为此,Jürgen 还和 GAN 的提出者 Ian Goodfellow 有过线上线下激烈的交锋,引起业界广泛讨论。

至于对深度学习三巨头 Hinton、Bengio 和 LeCun,Jürgen Schmidhuber 也打过几轮口水仗,认为三人在自己的圈子里玩,对深度学习领域其他更早期先驱人物的贡献则只字不提。

Reddit热议:Schmidhuber太过领先于时代

很多你以为新的东西其实早就存在了

feelings_arent_facts:我也一直在谈论DeepMind。DeepMind(和OpenAI)的发现并不比学术文献中已经发现的更新。他们只是碰巧拥有一支强大的前端和设计团队,以使其广为宣传,并为大众所用而已。

NER0IDE:例如DQN。以前很多人已经将函数逼近应用于Q网络。他们确实添加了一些技巧来使学习更加稳定,但是这个想法并不新鲜。

glockenspielcello:这是我认为人们会误会的地方。实际上,作为一个工程研究机构,DeepMind在许多方面其实更像个纯粹的科研机构。是的,他们并不一定在概念上取得任何突破,但这并不会减少使系统真正发挥作用的工程实践的价值。

之所以没有引用你的工作,是有客观原因的!

NewFolgers:电灯泡是两个人在同一天发明的。电话也是如此。随着GPU的处理技术的进步,2000年代末开始了深度学习的真正曙光,随后不久便开始了爆炸式增长。

我不是要淡化Schmidhuber和他的团队的才华和创新。我认为Schmidhuber及其团队的作品未得到足够重视的原因,是因为它太过领先于时代。任何领先时代的产物都需要从战略上重新审视。

相比图灵奖得主的影响力,我认为Schmidhuber及其团队成果的影响力微乎其微。从一个游戏开发人员的角度来看,这种情况一直存在。尤其是在ML不断加速行业工具和知识迭代的今天,我们要的是在最快的时间、找到正需要的东西。

Henry__Gondorff:我完全可以理解他的沮丧。由于我们的科学家没有得到足够的报酬,因此认可我们的工作就是对我们的最大奖赏。

但是,从他那里读到的内容来看,我必须说,我完全可以理解为什么他未被认可!他的作品(至少对我来说)很难理解,而且他经常将事情的“相似性”延伸得很远,与Goodfellow的互动就是一个很好的例子。科学不仅与发现有关,让其他科学家了解您的工作同样重要。在这一方面,他显然缺乏。

另外:,为什么像Hinton,Goodfellow等几乎所有的天才都拒绝了他的主张?是阴谋反对他吗?不,他们没有理由这样做。或者,更可能的一种推测是:他们都读了他的著作而忽略了它,因为它还不够重要。

另一个可能的原因是影响力会随着时间的流逝“衰落”。即使他提出了所有这些东西,都太久远了。人们的注意力跨度很短,旧的东西很快就会被人遗忘,这就是世界运转的方式。

以我个人的观点:假设Schmidhuber确实是一位出色的科学家,他也是有点自大狂妄(我想即使是他的粉丝也不能否认这一点)如果不是这次事件,可能没有人会知道他的名字。

并且,滥用审稿人的职位,来迫使另一位科学家引用你的那些显然无关的工作,是一件恶心的事情。

参考链接:https://www.reddit.com/r/MachineLearning/comments/e3buo3/d_five_major_deep_learning_papers_by_geoff_hinton/

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-11-30,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 新智元 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
CSS 实现时间轴、背景图 Loading 和渐变边框
本文将通过一个实际应用场景,展示如何使用现代 CSS 实现时间轴、背景图 loading 效果、渐变边框等效果。
Cell
2024/11/21
2840
CSS 实现时间轴、背景图 Loading 和渐变边框
同事用Excel花了半小时做甘特图,我用一工具只用10分钟
经常与数据打交道的人都知道,当我们有一个大计划需要按照进度执行的时候,或者需要统一管理所有工作的任务与资料的时候,就需要一个好用的项目管理工具,甘特图就是最高的工具!
大数据分析不是事儿
2021/02/03
3.4K0
项目管理修炼之道
前言 我的藏书中有一些非常经典,如迪马可、温伯格、布鲁克斯、麦康乃尔、考克伯恩、麦卡锡还有汉弗莱写的书 从项目管理相关的教科书与PMP的培训教材里能够学到的是一个项目经理需要具备的基本技能。这些技能只能让你成为一名项目经理,但是无法让你成为优秀的项目经理,其中的差异就在于是否有实战经验的积累 并不具有对项目整个图景清晰、理智的分析和认知,没有详细考量项目的驱动因素、约束、风险等。总而言之,就是没有一套成体系的理论、方法和实践 你的项目每天都在加快节奏,你的客户变得越来越不耐烦,大家越来越不能容忍无法正常工作
yeedomliu
2021/03/16
7600
项目管理修炼之道
Excel制作 项目里程碑图
A列日期、B列milestone、C列是 里程碑文字显示的位置(高度,负数会显示在下面)、D列是X轴日期显示的高度。
PM吃瓜
2020/07/14
5.5K0
Excel制作 项目里程碑图
是的!Figma也可以用时间轴做超级流畅的动画了
静电说:继昨天我们发布了Figma下的一款超神奇的抠图插件后,今天静电再次为大家带来一款Motion插件,它可以在Figma中做帧动画。在通常情况下,Figma中是没有时间轴的,因此只能使用Smart Animate做一些补间过渡动画,而要做一些更流畅且具有更多细节的动画,Figma则显得有点无奈。不过没关系,今天,我们为大家介绍使用Motion插件在Figma中来完成超流畅动画的案例。一起来看Pavel Babkin的这篇文章。
用户5009027
2021/03/15
21.1K0
是的!Figma也可以用时间轴做超级流畅的动画了
用intouch建立趋势图公共模板
大家在用组态软件时可能会需要一个功能,就是需要针对部分重要的仪表创建对应的趋势图,最好是小弹窗形式,以方便在观察该数据的趋势同时,也能了解到生产情况。但是如果每个仪表都建立对应的趋势图,既浪费资源,维护又不方便,所以需要建立一个公共弹窗,每次都是调用这一个弹窗,显示不同的数据趋势。
剑指工控
2021/11/09
2K0
用intouch建立趋势图公共模板
专业流程图制作工具Microsoft Visio中文版,Visio软件下载安装
Visio 是一款由微软公司开发的流程图、组织结构图和其他类型的图表的绘图软件。它可以帮助用户轻松地创建各种各样的图表,以便更好地展示和传达信息。Visio 软件非常适合用于商业、科研、教育等领域。
用户10436734
2023/03/27
3.5K0
专业流程图制作工具Microsoft Visio中文版,Visio软件下载安装
Excel图表学习72:制作里程碑图
1.复制原始数据并将其粘贴到指定位置,添加一个“位置”列(如下图2所示),以确定将里程碑显示在时间轴的上方还是下方。
fanjy
2021/07/30
5.2K0
不用甘特图,你做什么项目管理
当你根据以上的规则绘制好第一版甘特图以后,你会发现有些地方是可以继续调整的,但是这种调整,在你没有画图之前是不能发现的。于是你会在调整甘特图的过程中,让项目的规划越来越清晰。
青南
2018/08/31
7.3K0
不用甘特图,你做什么项目管理
软件工程 怎样建立甘特图
甘特图(Gantt chart )又叫横道图、条状图(Bar chart)。它是以图示的方式通过活动列表和时间刻度形象地表示出任何特定项目的活动顺序与持续时间。它是在第一次世界大战时期发明的,以亨利·L·甘特先生的名字命名,他制定了一个完整地用条形图表进度的标志系统。由于甘特图形象简单,在简单、短期的项目中,甘特图都得到了最广泛的运用。
Meng小羽
2019/12/23
5.2K0
Macromedia flash制作落叶飘下动画
2.选中引导层,在左侧工具栏中设置笔触颜色为黄色,填充颜色为无,在舞台上绘制一条路径。并锁定引导层。
全栈程序员站长
2022/08/18
1.5K0
Macromedia flash制作落叶飘下动画
利用Tableau绘制辐射堆叠图,炫酷易上手
我在不久前见到过这样的图,我就想可以写一篇关于如何在Tableau中创建辐射堆叠图,这是个基于合计百分比运算的堆叠图,但整体的形状是圆形的,作图的整个过程十分有趣,我希望你可以享受它。
朱小五
2020/04/16
1.5K0
利用Tableau绘制辐射堆叠图,炫酷易上手
构建企业级监控平台系列(三十):Grafana Panel 面板和 Time series(时间序列)
面板(Panel)是 Grafana 中基本可视化构建块,每个面板都有一个特定于面板中选择数据源的查询编辑器,每个面板都有各种各样的样式和格式选项,面板可以在仪表板上拖放和重新排列,它们也可以调整大小,所以要在 Grafana 上创建可视化的图表,面板是我们必须要掌握的知识点。
民工哥
2023/11/08
5.9K0
构建企业级监控平台系列(三十):Grafana Panel 面板和 Time series(时间序列)
7种方式玩转信息可视化中的时间线设计
作者:当归视觉工作室Donegood_Studio 网址:www.donegood.cn 导读:时间常常被认为是一种主观的体验,然而在可视化的表达中,时间却成为了结构化维度。时间帮助我们构建稳健而直观的框架,使我们更好地建立事件间的联系。 按照时间线的方式阐述信息已经广泛应用于企业传播、营销的各个领域。从小扎、雷总介绍新产品,到日常做年报、里程碑事件的PPT,我们都能发现时间线的身影。或许你和我一样抱有疑惑:怎样才能将时间线用得出彩?那么今天我们不妨看看以下七种有意思的时间线设计。 时间线的构成 要玩转时间
大数据文摘
2018/05/21
1.4K0
10个适用于WordPress的最佳时间轴插
您可能要考虑使用时间轴插件。 时间轴插件可以帮助观众以生动有趣的视觉方式讲述您的故事。
星姮十织
2022/01/02
2.4K0
高速串行总线设计基础(四)眼图的形成原理
眼图的测量对于高速串行总线的重要性不言而喻,眼图反映了总线通道环境的优劣,信号的好坏等等,正确的识别眼图是一项基础技能,如果具体识别眼图呢?下面详细地与你分享!
Reborn Lee
2020/12/29
2.4K0
高速串行总线设计基础(四)眼图的形成原理
数据可视化?不如用最经典的工具画最酷炫的图
做数据分析和做科普是类似的,科普的意义在于将晦涩难懂的科学知识,以让大众更易接受和理解的方式呈现。而数据分析中的数据可视化做的正是如此关键中的关键,即是将数据的特点以一种显而易见的形式进行呈现。但也不必说的那么高级,我们可以说数据可视化就是“画图”。
朱小五
2021/04/21
2.8K0
数据可视化?不如用最经典的工具画最酷炫的图
PS模块第九节:PA PLM210详细练习
声明:本文仅代表原作者观点,仅用于SAP软件的应用与学习,不代表SAP公司。注:文中所示截图来源SAP软件,相应著作权归SAP所有。
齐天大圣
2022/03/07
1.7K0
PS模块第九节:PA PLM210详细练习
一分钟绘制磷脂双分子层:AI零基础入门和基本图形绘制
Adobe illustrator是一种应用于出版、多媒体和在线图像的工业标准矢量插画的软件,是一款非常好的图片处理工具,简称AI。
生信宝典
2018/10/25
7.7K0
一分钟绘制磷脂双分子层:AI零基础入门和基本图形绘制
电商管理系统原型分享- E-Market
随着电商行业的发展,传统的管理方法正逐步被信息化管理所取代,电商信息管理系统地作用也越来越大。针对商家开发的电商管理系统,实现了对客户、商品、交易的管理和信息统计功能,从而提升了线上商城维护的工作效率和质量。
奔跑的小鹿
2020/03/10
1.8K0
电商管理系统原型分享- E-Market
推荐阅读
相关推荐
CSS 实现时间轴、背景图 Loading 和渐变边框
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档