Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >坏论文都写不满8页?这位顶会主席训练了一个好坏论文“颜值”分类器

坏论文都写不满8页?这位顶会主席训练了一个好坏论文“颜值”分类器

作者头像
刀刀老高
发布于 2019-01-02 10:41:35
发布于 2019-01-02 10:41:35
2K0
举报
文章被收录于专栏:奇点大数据奇点大数据

转载公众号:(大数据文摘出品)

最近几年,研究者往计算机视觉领域的顶会投的论文越来越多。下图就能明显看出这一趋势,尤其是从2016年开始,论文提交的数量成指数型增长。如此激烈的竞争也让很多研究者颇为焦虑,到底什么样的论文更容易被顶会收录呢?

好论文到底长啥样?

来自弗吉尼亚理工学院的Jia-Bin-Huang教授利用神经网络生成了一个识别好坏论文的分类器,通过输入论文的整体版面的视觉情况(就是看“脸“)来使分类器预测一篇论文应不应该被接收。

简单来说就是,这位研究者希望告诉大家,在论文内容不变的情况下,如何排版和撰写更能写出一篇“好论文”。

论文立刻成为了今天学术圈的热门话题,先来看看作者得出的几个结论:

  • 好论文的特点:第一页中都有预告图用于说明主要思想,有各种表格/图表均衡插入论文各处,来展示验证性实验,有重要的数学方程式,以及有彩色图像列表来量化数据集的基准。
  • “坏论文”的特点:通常都写不满8页;前两页缺少数字和插图会让读者看不懂。

除了给研究者写论文的参考,作为CVPR 2019、ICCV 2019的领域主席,作者更希望通过论文中提到的“好坏论文分类器”,来减轻论文审核人的工作量。

最终得出的结论从数据上说值得一看。根据测试数据集的检验,此分类器允许0.4%容错率的情况下(拒绝0.4%好论文),能够准确的判断出50%的“垃圾”论文。总的来说,在论文数量庞大,审稿人有限的现实下,这个分类器能够大大减少工作量。

作者还自嘲了一下,自己这篇论文拿给分类器审核,得出的结论是97%的概率会被拒稿。

研究方法

训练这个分类器所使用的训练数据集是2013~2017年CVPR和ICCV的会议论文,将这些数据丢进神经网络,根据论文的“颜值”,输出论文的质量。用2018年CVPR的论文进行验证,准确率达到92%。

此外,Jia-Bin-Huang还为广大的计算机视觉领域的研究者提供了一些建议,帮助他们提高论文美录用率。

研究方法的创新之处,是在训练数据的过程中并不是直接学习图像的映射。而是通过端到端的训练过程,以深度学习的方式重新审视“颜值”问题,从而能够学习特定任务的表现形式。

数据集获取:如何定义好论文和坏论文

研究者从计算机视觉顶会的接收论文列表中收集正样本(好的论文)。

因为无法获取到被拒绝的论文,研究者用workshop的文章做一个近似。

当然,作者也对这一“差论文”的数据集进行了说明,毕竟非常多的workshop论文也会被重要会议收录。

同时,workshop的文章被认作“hard negative”,有很多文章被评论和复审标示出来从而得到了改进。

数据处理

数据获得和处理。介绍一些平常运用这些数据集的具体步骤。

文件分类:一些workshop对于主要会议文章的有其特定的版面要求,例如需要6页的内容是与数据来源相关。分类就变得不那么重要。我们因而只保留7页多一点就已足够。

PDF2Image::我们用一种基于python的软件-pdf2image-把pdf文件转换成图片,然后剪裁成2 × 4网格大小。如果缺失第八页,我们就给它放一空页。原始转换后的图片有2200 × 3400像素那么大。

预处理:避免数据落项,我们会把首页标题去掉。如果不做这一步,分类器很多时候就会出现故障,它就只关注标题部分而忽视了整篇文章可视化的内容。

整体数据集获取:

https://github.com/vt-vl-lab/paper-gestalt

结论

到底好论文长什么样?

如何提高论文的录用率,当然颜值要过关啦,为此,作者利用GAN训练了一个好论文的生成器。数据集仍然采用2013~2017年的顶会数据集。训练硬件使用两个英伟达出品的芯片(NVIDIA Titan V100 GPU),整个训练过程大约需要一周的时间。

15个随机生成的好论文样本

训练结果如何?上图是生成器生成的15个随机样本,他们都有共同的特点:图表,方程平衡布局。但是看起来很费力气,尤其是在生成数字和表格方面。这个难怪,因为,训练集中的每个图形和表格都是独立的。

用生成器修改过的文章看起来并不完美,所以它的利用效能还是很有限,尤其是它很难保持一个特定的模板来确定一个正要发表的文章的好坏。

此外,我们也想把坏文章变得好一点。没那么多文章可以练手,就用神经转积神经网络,对不一样的两图进行匹配。这很像我们之前用2013-2017的会议和workshop文章所做的实验。

坏论文应该是什么样子?上图所示,他们的特点是,整篇论文的页数没有达到8页。另外在论文的前两页缺少说明性的文字,可能也会被判定为坏论文。

好论文该有的样子

好论文是什么样子,至少在正文第一页中要有让读者有看下去的冲动,例如在开头说明论文“性感”的主题思想,放上令人印象深刻的数学公式,以及用实验数据生成的漂亮的图像。

争议

这一论文一经发布,立刻引发巨大争议。

不少同学评论,“有意思”,毕竟这一研究结果可以为自己在顶会上发文章提供一些参考。

但是也有非常多的质疑声。最大的问题就是,关于给好论文设指标这件事,本身就是个伪命题啊。

在reddit有同学直接指出,一旦这个论文套路被所有人熟知,那么明年的论文评审规则必定跟这个规则不一样了。

大家搬出了古德哈特定律来说明这一问题。

注:古德哈特定律(Goodhart's law) ,是以 Charles Goodhart的名字命名的,这是一个非常有名的定理:当一个政策变成目标,它将不再是一个好的政策。简单来说,它认为一项指标一旦成为政策制定的依据,便立刻不再有效。政策制定者会牺牲其他方面来强化这个指标,使得这个指标不再具有指示整体情况的作用。

不管如何,感兴趣的同学还是可以看看这篇论文。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-12-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 奇点 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
五年后的计算机视觉会是什么样?和CV先驱们一同畅想(下) | CVPR2019
AI 科技评论按:计算机视觉顶会 CVPR 2019 上举办了首届「Computer Vision After 5 Years - CVPR Workshop」,领域内的多位知名学者受邀演讲,和大家分享他们对于 5 年后的计算机视觉领域发展的看法。
AI科技评论
2019/07/05
6040
五年后的计算机视觉会是什么样?和CV先驱们一同畅想(下) | CVPR2019
凭“颜值”拒稿,误判率仅0.4%?这篇计算机视觉论文让AI学界炸了锅
不少人哈哈哈哈怀疑作者在搞笑,当然也有很多人严肃读论文,辩论数据、结论的不合理之处。甚至有人说,研究揭示了论文评审中本就存在的人类偏见。
量子位
2018/12/28
5760
业界 | 44篇论文强势进击CVPR 2018,商汤科技的研究员都在做哪些研究?
自 2012 年以来,经过视觉领域诸多学者们的不懈努力,「物体识别」、「人脸检测」等传统任务的性能在一定程度上达到饱和,因此纵观本届 979 篇入选论文,我们会看到研究者们纷纷将目光转向近年来的一些新兴问题。在今年,商汤的研究者们就大规模分布式训练、人体理解与行人再识别、三维场景理解与分析、底层视觉算法、物体检测、识别与跟踪、深度生成式模型、视频与行为理解等多个问题展示了自己的最新工作。
机器之心
2018/07/26
4730
你的论文能否中顶会?这篇分析同行评审结果的论文可帮助你
选自arXiv 作者:Dongyeop Kang等 机器之心编译 参与:Nurhachu Null、李亚洲、李泽南 在人工智能领域,会议论文是证明研究人员学术水平的重要一环。是否存在一些「技巧」可以提高论文被大会接收的几率?人工智能是否可以帮助我们?近日,来自卡耐基梅隆大学(CMU)研究者们收集了上万篇 AI 顶级会议的接收/被拒论文,并使用机器学习工具进行分析,获得了一些有趣的结果。最后,当然……这一研究的论文已经被即将在 6 月 1 日于美国举行的自然语言处理顶会 NAACL 2018 接收。 项目
机器之心
2018/06/08
8870
专访中国香港大学罗平:师从汤晓鸥、王晓刚,最早将深度学习应用于计算机视觉的「先行者」
虽然 ICCV 2019 落幕已近两周,但是这场对于华人研究者而言具备「转折点」意义的国际学术顶会在大家心中掀起的波澜,想必依旧未了。
AI科技评论
2019/11/26
1.7K0
Facebook介绍ICCV2017收录论文,其中五分之一都有何恺明的名字(附下载链接)
本周,全球的计算机视觉专家们即将齐聚威尼斯参加 ICCV (International Conference on Computer Vision)2017,展示计算机视觉和相关领域的最新研究进展。ICCV由IEEE主办,与计算机视觉模式识别会议(CVPR)和欧洲计算机视觉会议(ECCV)并称计算机视觉方向的三大顶级会议。CVPR每年召开一次,而ECCV和ICCV在世界范围内每年间隔召开。ICCV论文录用率很低,也符合它顶级会议的地位。 今年ICCV中,Facebook有15篇论文被收录,同时Faceboo
AI研习社
2018/03/19
9960
分类器可视化解释StylEx:谷歌、MIT等找到了影响图像分类的关键属性
神经网络可以非常出色地执行各种任务,但它们是如何做出决定的呢?例如,在图像分类任务中,模型是如何确定一张图像属于这一类而不是属于另一类,这通常是一个谜题。解释神经网络如何做决策的过程,可能会在某些领域产生重大的社会影响,例如医学图像分析和自动驾驶。
机器之心
2022/02/24
4110
分类器可视化解释StylEx:谷歌、MIT等找到了影响图像分类的关键属性
你的厨房被水淹了!别担心,这只是3D深度估计做出的特效
这项研究由来自华盛顿大学、弗吉尼亚理工学院和 Facebook 的研究者合作完成。
机器之心
2020/05/19
7540
你的厨房被水淹了!别担心,这只是3D深度估计做出的特效
CVPR 2017 李飞飞总结 8 年 ImageNet 历史,宣布挑战赛最终归于 Kaggle
机器之心报道 参与:机器之心编辑部 2017 年 7 月 18 日,ImageNet 最后一届挑战赛成绩已经公布,多个国内院校和企业在各个比赛项目上取得了非常不错的成绩。据官网信息,在 CVPR 2017 期间也会有一场 Workshop 以纪念 ImageNet 挑战赛。当地时间 7 月 26 日,李飞飞与 Jia Deng 在 ImageNet Workshop 上做主题演讲,对 8 年的 ImageNet 挑战赛历史进行了总结,并宣布之后的 ImageNet 挑战赛将转由 Kaggle 主办。最后,感
机器之心
2018/05/09
1.2K0
CVPR 2017 李飞飞总结 8 年 ImageNet 历史,宣布挑战赛最终归于 Kaggle
CVPR 二十年,影响力最大的 10 篇论文!
今天,我们将对计算机视觉领域三大顶会之一CVPR在近二十年来中产生的优秀论文进行一个全面的盘点与总结。
AI算法与图像处理
2021/04/21
8300
CVPR 二十年,影响力最大的 10 篇论文!
ImageNet一作、李飞飞高徒邓嘉获最佳论文奖,ECCV 2020奖项全公布
计算机视觉三大国际顶级会议之一的 ECCV 2020 已经召开。受疫情影响,原定于 8 月下旬在英国格拉斯哥举行的 ECCV 2020 会议转为线上举行,为期 4 天。
机器之心
2020/08/28
7380
ImageNet一作、李飞飞高徒邓嘉获最佳论文奖,ECCV 2020奖项全公布
NIPS2018 | 腾讯AI Lab入选20篇论文,含2篇Spotlight
被誉为神经计算和机器学习领域两大顶级会议之一的NIPS于近日揭晓收录论文名单,此次为第32届会议,将于 12 月 3 日至 8 日在加拿大蒙特利尔举办。 腾讯AI Lab第三次参加NIPS,共有20篇论文入选,其中2篇被选为亮点论文(Spotlight),涵盖迁移学习、模仿学习、半监督学习等多个研究主题,去年我们入选论文8篇,含1篇口头报告(Oral)。 此外,在今年的多个顶级学术会议中,腾讯AI Lab也入选多篇论文,位居国内企业前列,包括计算机视觉领域顶会CVPR(21篇)和ECCV(19篇)、机
腾讯技术工程官方号
2018/10/17
13.9K0
NIPS2018 | 腾讯AI Lab入选20篇论文,含2篇Spotlight
博客 | ACM MM最佳论文全文:通过多对抗训练,从图像生成诗歌
雷锋网 AI 科技评论按:多媒体信息处理领域顶级学术会议 ACM MM 2018(ACM International Conference on Multimedia)于 2018 年 10 月 22 日至 26 日在韩国首尔举行。
AI研习社
2018/11/30
9200
博客 | ACM MM最佳论文全文:通过多对抗训练,从图像生成诗歌
从 ACL 2019 看 NLP 未来发展趋势
随着自然语言处理领域的顶级盛会 ACL 2019 落幕,亚马逊 Alexa AI 的机器学习科学家 Mihail Eric 对本次会议进行了一次比较全面的回顾。从奇闻轶事到学术前沿,本文一网打尽,自然语言处理领域的小伙伴们不要错过!
AI科技评论
2019/08/19
8070
从 ACL 2019 看 NLP 未来发展趋势
从2019 AI顶会最佳论文,看深度学习的理论基础
如果能有一种理论告诉我们什么样的模型架构、运算方式能最好地表示某种数据,什么样的损失函数、迭代方式能最高效地学习到某种能力,什么样的设置又使这种能力能处理各种意外情况。那么,这样的深度学习,乃至机器学习,才是理论基础圆润的大学科。
机器之心
2020/02/24
4960
从2019 AI顶会最佳论文,看深度学习的理论基础
2017年的10大AI顶会,风起云涌的故事 | 机器之心年度盘点
机器之心原创 作者:蒋思源、路雪 在过去的一年中,从 AAAI 到 NIPS 很多学术顶会都在关注人工智能和机器学习,而它们的参会情况与论文提交情况很大程度上都体现了这个领域的活跃程度。在本文中,机器之心概览了 2017 年人工智能顶会的参会情况、论文提交与接受情况、华人力量和获奖论文情况,我们希望读者能从这些观察中获得一些今年的趋势与研究主题。 文本主要分为两部分,第一部分是 2017 年顶会的概览,包括今年该领域 10 个顶会的论文提交与接受情况和它们的华人力
机器之心
2018/05/11
1.1K0
年度回顾 | 从九大国际AI顶会接收论文一窥ML算法趋势(上)
在本文的上篇,我们尝试分别从机器学习算法、计算语言处理、计算机视觉及机器人分领域对ML算法发展趋势进行总结。在本文的下篇,我们尝试打破领域的边界,形成一份全局性的总结。本文仅选取分析结论部分,详细数据及分析过程将收录在《2021-2022年度 AI科技发展趋势报告》完整版中。
机器之心
2022/02/23
8420
年度回顾 | 从九大国际AI顶会接收论文一窥ML算法趋势(上)
在测试集上训练,还能中CVPR?这篇IEEE批判论文是否合理?
Reddit 讨论地址:https://www.reddit.com/r/MachineLearning/comments/a8p0l8/p_training_on_the_test_set_an_analysis_of/
全栈程序员站长
2022/08/04
3700
回顾 | CVPR 2017完全指北:深度学习与计算机视觉融合的一年,未来又会是什么?
机器之心(海外)原创 作者:QW、CZ 参与:王灏、Panda 当地时间 7 月 21 日到 16 日,夏威夷火奴鲁鲁迎来了 2017 年计算机视觉与模式识别会议(CVPR)。今年的会议收到了 2620 份有效提交,其中有 783 篇论文被接收,其中又有 215 篇将进行长和短的演讲展示,分成了 3 个并行议程。本届会议吸引了 127 家赞助商,赞助资金 859000 美元。参会者数量接近 5000 人,在几年前才刚到 1000 人的基础上实现了显著的增长。本文带你回顾这场学术嘉年华(咖啡很赞!),不要错过
机器之心
2018/05/09
1.1K0
回顾 | CVPR 2017完全指北:深度学习与计算机视觉融合的一年,未来又会是什么?
ECCV 2018 | 旷视科技提出统一感知解析网络UPerNet,优化场景理解
论文名称:《Unified Perceptual Parsing for Scene Understanding》
机器之心
2018/09/20
1.9K0
ECCV 2018 | 旷视科技提出统一感知解析网络UPerNet,优化场景理解
推荐阅读
五年后的计算机视觉会是什么样?和CV先驱们一同畅想(下) | CVPR2019
6040
凭“颜值”拒稿,误判率仅0.4%?这篇计算机视觉论文让AI学界炸了锅
5760
业界 | 44篇论文强势进击CVPR 2018,商汤科技的研究员都在做哪些研究?
4730
你的论文能否中顶会?这篇分析同行评审结果的论文可帮助你
8870
专访中国香港大学罗平:师从汤晓鸥、王晓刚,最早将深度学习应用于计算机视觉的「先行者」
1.7K0
Facebook介绍ICCV2017收录论文,其中五分之一都有何恺明的名字(附下载链接)
9960
分类器可视化解释StylEx:谷歌、MIT等找到了影响图像分类的关键属性
4110
你的厨房被水淹了!别担心,这只是3D深度估计做出的特效
7540
CVPR 2017 李飞飞总结 8 年 ImageNet 历史,宣布挑战赛最终归于 Kaggle
1.2K0
CVPR 二十年,影响力最大的 10 篇论文!
8300
ImageNet一作、李飞飞高徒邓嘉获最佳论文奖,ECCV 2020奖项全公布
7380
NIPS2018 | 腾讯AI Lab入选20篇论文,含2篇Spotlight
13.9K0
博客 | ACM MM最佳论文全文:通过多对抗训练,从图像生成诗歌
9200
从 ACL 2019 看 NLP 未来发展趋势
8070
从2019 AI顶会最佳论文,看深度学习的理论基础
4960
2017年的10大AI顶会,风起云涌的故事 | 机器之心年度盘点
1.1K0
年度回顾 | 从九大国际AI顶会接收论文一窥ML算法趋势(上)
8420
在测试集上训练,还能中CVPR?这篇IEEE批判论文是否合理?
3700
回顾 | CVPR 2017完全指北:深度学习与计算机视觉融合的一年,未来又会是什么?
1.1K0
ECCV 2018 | 旷视科技提出统一感知解析网络UPerNet,优化场景理解
1.9K0
相关推荐
五年后的计算机视觉会是什么样?和CV先驱们一同畅想(下) | CVPR2019
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档