Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >北大研究人员这次发现了AI「躺平」原因,都是数据集的错!

北大研究人员这次发现了AI「躺平」原因,都是数据集的错!

作者头像
新智元
发布于 2023-05-22 08:25:21
发布于 2023-05-22 08:25:21
2620
举报
文章被收录于专栏:新智元新智元


新智元报道  

来源:arXiv

编辑:好困

【新智元导读】你有没有发现,每当AI发现了偷懒的小技巧之后,就不再去学习那些有挑战的问题并开始「躺平」?北大的研究人员表示:最好去看看你的训练集了。

在训练人工「智障」的时候,AI最后经常会学到一些莫名其妙的方式来完成人类的的任务。

有一些AI就会去学习如何通过「卡bug」来快速通关。

还有一些AI学会了「‍只要把游戏暂停了,我就不会输」这‍个终极哲学。‍

AI也想「躺平」

为了让模型能够提高准确性,通常会设置相应的奖励,但有时候模型在前期就发现了能够获得奖励的「捷径」。

但凡AI尝到了甜头,它就会一直选择去走这个「捷径」,不再去学习更困难的知识或者方法。

来自北京大学的研究人员在训练语言模型的时候就发现:AI虽然能回答正确,但是它搞不明白为什么答案是对的,只知道遇到某类问题用这个回答就可以了。

于是,研究人员决定要把AI「扶起来」,让它们「努力学习」不能偷懒。

论文地址:https://arxiv.org/pdf/2106.01024.pdf

这篇论文已经发表在arxiv上,作者是来自北京大学王选计算机研究所和北京大学计算语言学教育部重点实验室的Yuxuan Lai, Chen Zhang, Yansong Feng , Quzhe Huang,和Dongyan Zhao(赵东岩)

为什么AI总想去「躺平」?

尽管有些研究已经发现了AI总爱「躺平」的现象,但是他们并没有发现这个现象和数据集中的「捷径」问题有关。

为此,论文提出了一个经过标注的全新数据集,其中包括对一个问题的「捷径版」和「挑战版」两种回答。

数据集使用「释义」( paraphrasing )作为更复杂和更深入答案的标准,因为想要表达出学到的知识,语义理解是必要的。相比之下,「捷径」的答案是有如日期或其他关键字生成的,但没有任何上下文或推理。

研究人员发现,训练集中「捷径版」样本越高,就越会阻碍模型学到「释义」从而去解决具有挑战性的问题。而模型在回答「捷径版」问题时的表现则基本稳定。

文章表明,当训练集中有足够多的「挑战版」问题时,模型不仅能更好地理解「挑战版」问题,而且也能正确回答「捷径版」问题。

AI是如何学会「躺平」的?

文章表示,在训练的早期阶段,模型往往会找到最简单的方法达到梯度下降从而拟合训练数据。而且由于「捷径」需要较少的计算资源来学习,因此拟合这些技巧会变成一个优先事项。

之后,由于模型学会的「捷径」可用于正确回答大部分训练问题,因此剩余的问题便无法激励模型继续去探索「挑战版」问题需要的复杂解决方法。

有没有办法把AI「扶起来」?

除了NLP架构本身的问题外,也很可能是训练过程中标准优化和资源保护的结果,以及让模型在短时间内以有限的资源去获得结果的压力。

如文章所说的那样,数据预处理领域可能需要考虑将数据中的「捷径」视为一个亟待解决的问题,或者是修改 NLP 架构从而达到优先考虑更具挑战性的数据的效果。

参考资料:

https://arxiv.org/pdf/2106.01024.pdf

推荐阅读:

图灵奖得主Bengio又出新论文,用强化学习提升模型泛化性,Reddit崩溃:idea撞车了!

十年让70+种语言无障碍沟通?他们决心用系统性创新攻克业内公认难题

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-06-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 新智元 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
秒杀Deepfake!微软北大提出AI换脸工具FaceShifter和假脸检测工具Face X-Ray
最先进的AI和机器学习算法不仅可以生成栩栩如生的位置和物体的图像,还擅长将人脸头像从一个人换成另一个人的。另一方面,研究人员也在不断开发能够检测deepfake假图像的识别工具。这场在机器学习图像识别领域的“矛与盾”之争愈演愈烈。
新智元
2020/02/13
2.5K0
国内学者新研究:中医AI登场,自动开出药方
问耕 发自 凹非寺 量子位 出品 | 公众号 QbitAI 啊~医学,一个正在被人工智能改变的领域。 一讲到这个,常见的报道大都是AI阅X光片无数,无师自通成良医。前不久,FDA还批准通过了首个AI设
量子位
2018/03/02
3K0
国内学者新研究:中医AI登场,自动开出药方
北大孙赫:用 AI 研究科学成像,从「大宇宙」到「小宇宙」
科学家需要什么样的 AI 工具?非计算机科班出身的孙赫在将深度学习用于研究天文成像与生物成像的过程中,有自己的思考。 作者 | 陈彩娴、王玥 编辑 | 岑峰 2022年5月12日,全球知名的黑洞观测计划「事件视界望远镜」(Event Horizon Telescope,EHT)发布了一张位于银河系中心的超大质量黑洞「人马座A*」(Sgr A*)的照片。 该照片提供了银河系中心黑洞真实存在的首个视觉证据,在世界范围内引起了巨大的轰动: 图注:位于银河系中心的黑洞——「人马座A*」(Sgr A*)。这张照片由
AI科技评论
2022/06/07
9190
北大孙赫:用 AI 研究科学成像,从「大宇宙」到「小宇宙」
7 Papers | DeepMind用AI重写排序算法;将33B大模型塞进单个消费级GPU
论文 1:Faster sorting algorithms discovered using deep reinforcement learning
机器之心
2023/08/07
2770
7 Papers | DeepMind用AI重写排序算法;将33B大模型塞进单个消费级GPU
微软北大联合提出换脸 AI 和脸部伪造检测器,演绎现实版「矛与盾」?
一个致力于造假,一个专注于打假;光是听起来,就不禁让人联想到「矛」与「盾」的故事。那到底哪个更胜一筹呢?VB 发布了的相关内容介绍了这两个成果,我们将其整理及编译如下。
AI研习社
2020/02/12
5000
在AI眼前“隐身”,谷歌研究人员使用特制贴纸迷住AI
企鹅号小编
2018/01/05
7160
在AI眼前“隐身”,谷歌研究人员使用特制贴纸迷住AI
ACL 2018 奖项全公布,北大、哈工大上榜,Mark Steedman 获终身成就奖
AI 科技评论按:ACL 2018 于 7 月 15 日在墨尔本正式开幕,随着会议议程的推进,今天迎来大会的重头戏——ACL 奖项颁布仪式。
AI科技评论
2018/07/27
3730
ACL 2018 奖项全公布,北大、哈工大上榜,Mark Steedman 获终身成就奖
7 Papers & Radios | Meta「分割一切」AI模型;从T5到GPT-4盘点大语言模型
机器之心 & ArXiv Weekly  参与:楚航、罗若天、梅洪源 本周论文包括 Meta 发布「分割一切」AI 模型;国内 20 余位研究者联合撰写大型语言模型综述等。 目录 Segment Anything Dynamic Prompt Learning via Policy Gradient for Semi-structured Mathematical Reasoning A Survey of Large Language Models HuggingGPT: Solving AI Tasks
机器之心
2023/04/11
4260
7 Papers & Radios | Meta「分割一切」AI模型;从T5到GPT-4盘点大语言模型
北大联手腾讯提出LanguageBind  | 更直接的多模态对齐框架,刷新多个榜单!
北大联手腾讯提出LanguageBind | 更直接的多模态对齐框架,刷新多个榜单!
公众号-arXiv每日学术速递
2023/11/14
1.8K0
北大联手腾讯提出LanguageBind  | 更直接的多模态对齐框架,刷新多个榜单!
大模型帮陶哲轩解题、证明数学定理:数学真要成为首个借助AI实现突破的学科了?
去年 2 月份,DeepMind 发布了编程辅助利器 AlphaCode。它使用人工智能技术来帮助程序员更快地编写代码,可以自动完成代码、提供代码建议并检查错误,从而提高编程效率。AlphaCode 的问世意味着 AI 在解决现实世界问题的道路上又迈出了一大步。
机器之心
2023/08/07
4350
大模型帮陶哲轩解题、证明数学定理:数学真要成为首个借助AI实现突破的学科了?
人类绝望,机器接盘:用AI自动发现三体的守恒定律!北大校友与《生命3.0》作者共同杰作
熟悉《三体》的科幻爱好者们都知道,三体人所在行星围绕着三颗恒星运行。不仅行星轨道极其不稳定,连三颗恒星之间的相对位置也变化无穷。所以,三体人经常要面临灭绝性的气候,不是严寒就是酷热,搞得三体人总是不能安心地建立长久的文明,时不时被打断。要么暂时像水熊虫一样脱水躲避灾难,要么就得从头再来。
AI科技评论
2021/05/19
6520
人类绝望,机器接盘:用AI自动发现三体的守恒定律!北大校友与《生命3.0》作者共同杰作
不被大神Hinton认同,否定现有同行成果,谷歌这篇烧脑研究最终拿下ICML2019最佳论文
今年,共有3424篇论文提交到这场一年一度的机器学习国际顶会上,大会共接收了774篇。有两篇论文,从千军万马中脱颖而出,成为ICML 2019最佳论文。
zenRRan
2019/06/19
4340
不被大神Hinton认同,否定现有同行成果,谷歌这篇烧脑研究最终拿下ICML2019最佳论文
20亿参数+30亿张图像,刷新ImageNet最高分!谷歌大脑华人研究员领衔发布最强Transformer
近日,谷歌大脑团队公布了Vision Transformer(ViT)进阶版ViT-G/14,参数高达20亿的CV模型,经过30亿张图片的训练,刷新了ImageNet上最高准确率记录——90.45%,此前的ViT取得的最高准确率记录是 88.36%,不仅如此,ViT-G/14还超过之前谷歌提出的Meta Pseduo Labels模型。
新智元
2021/07/06
4600
2022 Top10自监督学习模型发布!美中两国8项成果霸榜
自监督学习使计算机能够观察世界,通过学习图像、语音或文本的结构来了解世界,这推动了人工智能最近的许多重大进展。
算法进阶
2023/01/14
5480
2022 Top10自监督学习模型发布!美中两国8项成果霸榜
给ChatGPT喂黑话学得贼快,网友:你把AI教恶心了我们还怎么玩?
梦晨 萧箫 发自 凹非寺 量子位 | 公众号 QbitAI ChatGPT彻底让网友们陷入疯狂,也带🔥了一众理论研究。 原因无他,这只AI说话太“对味”,不仅准确掌握沟通要领,就连人类的语言艺术都玩得明明白白。 这不,让它模仿产品经理挂在嘴边的“赋能”、“抓手”和“闭环”: △图源@LeaskH,省略300+黑话词汇 ChatGPT张口就来: △图源@LeaskH 味实在太冲,网友直呼“把AI教恶心了”: 但要知道,直到ChatGPT之前,语言模型还做不到精准get沟通要领,不仅回答经常驴唇不对马
量子位
2023/02/28
4590
给ChatGPT喂黑话学得贼快,网友:你把AI教恶心了我们还怎么玩?
2022 Top10自监督学习模型发布!美中两国8项成果霸榜
自监督学习使计算机能够观察世界,通过学习图像、语音或文本的结构来了解世界。这推动了人工智能最近的许多重大进展。
新智元
2023/01/07
3730
2022 Top10自监督学习模型发布!美中两国8项成果霸榜
AI理解不了“他她它”咋办?动词成为新突破口,机器人听到抹黄油就知道拿刀叉 | 清华AIR&北大&英特尔
但要是换成只有代词(他/她/它/这/那/东西…)和动词的模糊指令,AI就一头雾水了:
量子位
2022/12/09
2710
AI理解不了“他她它”咋办?动词成为新突破口,机器人听到抹黄油就知道拿刀叉 | 清华AIR&北大&英特尔
再见AI黑匣子:研究人员教会AI进行自我解释
---- 新智元编译 来源:thenextweb 作者:艾霄葆 【新智元导读】AI决策过程的黑匣子问题一直是AI领域最大的担忧之一,但近期黑匣子决策问题似乎被破解。来自加州大学伯克利分校、阿姆斯特丹大学、Facebook AI Research团队的研究人员创建出一个AI自我解释模型,该模型可使AI在回答问题时指出问题对应的证据,在回答相关图像问题时,其能够为其决策提供自然语言理由并指出图像显示证据。 来自加州大学伯克利分校、阿姆斯特丹大学、Facebook AI Research团队的研究人
新智元
2018/03/12
9370
再见AI黑匣子:研究人员教会AI进行自我解释
Bing研究人员开发新的方法,用于自动收集高质量AI训练数据
微软Bing团队的研究人员已经开发出一种用于训练机器学习模型的高质量数据生成方法。CVPR会议之前发表的博客文章和论文中,他们描述了一个系统,该系统能够以准确的一致性区分准确标记的数据和标记不准确的数据。
AiTechYun
2018/07/27
4600
Bing研究人员开发新的方法,用于自动收集高质量AI训练数据
如何让AI模型学会“自我纠错”?Gemini 用上一种全新的强化学习方法
最近 Google 出了一篇论文,他们似乎找到了办法让 AI 自动纠错,他们把这项技术用在了 Gemini 上,这项技术就是就是Self-Correct。不知道你有没有过这样的体验:跟AI对话时,AI说错了某些信息,但却没有意识到自己错了,甚至重复错误?这不仅让人头疼,还会让你怀疑AI的智能水平。不过,最近的一项研究正在试图解决这个问题——让AI模型自己学会“自我纠错”,通过一种叫做强化学习的方法。
老码小张
2024/09/21
5600
如何让AI模型学会“自我纠错”?Gemini 用上一种全新的强化学习方法
推荐阅读
秒杀Deepfake!微软北大提出AI换脸工具FaceShifter和假脸检测工具Face X-Ray
2.5K0
国内学者新研究:中医AI登场,自动开出药方
3K0
北大孙赫:用 AI 研究科学成像,从「大宇宙」到「小宇宙」
9190
7 Papers | DeepMind用AI重写排序算法;将33B大模型塞进单个消费级GPU
2770
微软北大联合提出换脸 AI 和脸部伪造检测器,演绎现实版「矛与盾」?
5000
在AI眼前“隐身”,谷歌研究人员使用特制贴纸迷住AI
7160
ACL 2018 奖项全公布,北大、哈工大上榜,Mark Steedman 获终身成就奖
3730
7 Papers & Radios | Meta「分割一切」AI模型;从T5到GPT-4盘点大语言模型
4260
北大联手腾讯提出LanguageBind  | 更直接的多模态对齐框架,刷新多个榜单!
1.8K0
大模型帮陶哲轩解题、证明数学定理:数学真要成为首个借助AI实现突破的学科了?
4350
人类绝望,机器接盘:用AI自动发现三体的守恒定律!北大校友与《生命3.0》作者共同杰作
6520
不被大神Hinton认同,否定现有同行成果,谷歌这篇烧脑研究最终拿下ICML2019最佳论文
4340
20亿参数+30亿张图像,刷新ImageNet最高分!谷歌大脑华人研究员领衔发布最强Transformer
4600
2022 Top10自监督学习模型发布!美中两国8项成果霸榜
5480
给ChatGPT喂黑话学得贼快,网友:你把AI教恶心了我们还怎么玩?
4590
2022 Top10自监督学习模型发布!美中两国8项成果霸榜
3730
AI理解不了“他她它”咋办?动词成为新突破口,机器人听到抹黄油就知道拿刀叉 | 清华AIR&北大&英特尔
2710
再见AI黑匣子:研究人员教会AI进行自我解释
9370
Bing研究人员开发新的方法,用于自动收集高质量AI训练数据
4600
如何让AI模型学会“自我纠错”?Gemini 用上一种全新的强化学习方法
5600
相关推荐
秒杀Deepfake!微软北大提出AI换脸工具FaceShifter和假脸检测工具Face X-Ray
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档