Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >训练AI太辛苦?OpenAI新方法:不如让AI之间互教吧

训练AI太辛苦?OpenAI新方法:不如让AI之间互教吧

作者头像
量子位
发布于 2018-03-20 10:05:01
发布于 2018-03-20 10:05:01
8680
举报
文章被收录于专栏:量子位量子位
训练一个AI,往往需要喂大量的正确的合适的样例。

用什么样例合适?判断样例正确的标准是啥?又要多少人力来标注训练的数据?

这些问题想想都头大@_@

所以呢,OpenAI一伙人就在想,有没有可能让AI之间互相训练?

经过一番努力,OpenAI终于设计粗了一种AI互教的方法,且尽可能让AI用人类看得懂的样例来互教。

这种方法会选出一个最小样例合集,目的是用最少的样例把要AI学会的概念表达得最清楚。

打个比方说,要AI搞懂啥是狗,那么这方法就是要找出让AI搞懂的最好的一张图应该是什么样子的。

实验下来发现,介个方法对人类和AI来说,都很有效。

要知道在未来,那些革命性的AI应用,将会来自于机器和人类的共同合作。

不过,要让不同的AI都用同种语言是很难的。换句话说,现在缺乏一种AI通用语言。

试想一下,如果要你判断一个长方形的形状,是给你看长方形内部随机分布的点更容易,还是直接看长方形四个角上的点更简单?

让机器get到一个长方形的形状的最好showcase是左边的样例还是右边的样例?

当然是后者更快。

让机器互教的方法,是让两个智能体之间玩个合作类游戏,一个当学生,另一个当老师。

这个游戏的目标,对于学生那个神经网络来说,是要根据给出的样例,来get到所要学会的概念,比方说,给张狗狗的图,然后明白啥是汪星人;对于老师那个神经网络来说,就要搞清楚哪些样例教学生的效果最好,最能把事儿表达明白。

介个方法分两个阶段。

首先,随机给“学生”网络输入样例,然后用传统的监督学习型方法去判断出样例背后的标注。

然后,训练“老师”网络找出那些“学生”可以正确标注出来的样例。

通过不同的样例,找出这些样例的最小集。理论上来说就能用最少的样例教会“学生”特定的概念。

但如果像很多沟通类游戏那样,同时训练学生和老师,那么“学生”和“老师”之间有可能会用人类看不懂的样例来沟通。

比方说,“汪星人”这个概念,最终有可能是通过一些骆驼和摩托车图像的任意矢量来编码的,或者对于人类来说,两个看起来随机的点,对学生和老师来说却是个特定的矩形。

为了解释介个技术为什么起作用,可以想象一下,在训练“学生”识别示例图像中的概念时,是基于以下四个属性:尺寸大小(小,中,大),颜色(红色,蓝色,绿色),形状(正方形或圆形)和边框(实或虚)。

在这种情况下,一个概念由一组属性定义的。每个属性都是属于这个概念的子集。

比如说,这个概念是红色圆圈,那么任何尺寸、任何边界的红色圆圈都属于这个概念。

“老师”网络要做的是,找出所有符合这个概念样例的共性,排除掉没有决定性作用的属性。

例如,为了传授“红色”的概念,“老师”选择了一个没有边框的大红色方块,然后是一个带有边框的小红色圆圈。这两种形状的共同属性是红色,所以这个概念只能由红色组成。

OpenAI这套系统能够有效地找出那些最适合学生掌握概念的训练样例。

这种方法适用于布尔型,分层型,概率型和基于规则的概念。

“老师”网络发明的教学技术,可以反映出人类所设计的最优策略。

评价介个方法的另一个标准,是看人类能不能get到“老师”网络挑选出来的样例背后的概念。

结果发现,效果不错。比起随机提供的样例,用“老师”网络选出的样例,人类更能准确地判断出来背后的概念。

尽管,在这次的工作里,OpenAI只关注找出训练用的最有效样例。

但是以后要搞出我们人类能看懂的两个AI的沟通机制,也是可以用这个分开训练、机器互教的思路哒!(前方高能,OpenAI强插了个硬广)

如果你对这个课题感兴趣的话,快点加入OpanAI吧!

详细信息戳介里→https://openai.com/jobs/

最后,附该工作的论文,

https://arxiv.org/abs/1711.00694

编译来源,

https://blog.openai.com/interpretable-machine-learning-through-teaching/

p.s. 还是忍不住讲一句,大家新年快乐呀(。・∀・)ノ゛

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-02-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量子位 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
编辑精选文章
换一批
OpenAI DALL·E 3来了,集成ChatGPT,生图效果太炸了
终于,OpenAI 的文生图 AI 工具 DALL-E 系列迎来了最新版本 DALL・E 3,而上个版本 DALL・E 2 还是在去年 4 月推出的。
机器之心
2023/09/21
9590
OpenAI DALL·E 3来了,集成ChatGPT,生图效果太炸了
AI时代,陪孩子玩什么游戏?| 前Google资深工程师实战心法
相信不少家长都有过这样的思考和探索,但要找到一个理论与实践相统一、知行合一的参考并不容易。
量子位
2019/04/23
7040
AI时代,陪孩子玩什么游戏?| 前Google资深工程师实战心法
通俗易懂的目标检测 | RCNN, SPPNet, Fast, Faster
本文主要讲一下深度网络时代,目标检测系列的RCNN这个分支,这个分支就是常说的two-step,候选框 + 深度学习分类的模式:RCNN->SPP->Fast RCNN->Faster RCNN
机器学习炼丹术
2020/07/29
6850
DeepMind的AI学会了画画,利用强化学习完全不需人教
直播链接 2018 新智元产业跃迁 AI 技术峰会今天隆重启幕,点击链接观看大会盛况: 爱奇艺 http://www.iqiyi.com/l_19rr3aqz3z.html 腾讯新闻 http://v.qq.com/live/p/topic/49737/preview.html 新浪科技 http://video.sina.com.cn/l/p/1722511.html 云栖社区 https://yq.aliyun.com/webinar/play/419 斗鱼直播 https://www.
新智元
2018/04/18
9180
DeepMind的AI学会了画画,利用强化学习完全不需人教
大三少年造出AI写意画家,像人类一样挥笔作画丨已开源,有Demo
一切都像梦里一般,宫殿如同电影镜头那样显现,刚开始模糊抽象,定睛一看却是实景,绘画风格十分独特。
量子位
2019/05/13
6220
大三少年造出AI写意画家,像人类一样挥笔作画丨已开源,有Demo
7 Papers & Radios | OpenAI教GPT-3学会上网;爱因斯坦广义相对论通过严格检验
本周论文包括 OpenAI 教会了 WebGPT 上网;爱因斯坦广义相对论通过了一场历时 16 年的严格检验。
机器之心
2021/12/22
6240
7 Papers & Radios | OpenAI教GPT-3学会上网;爱因斯坦广义相对论通过严格检验
AI小画手,说GAN就干!
Google最近在微信发布了第一款微信小程序——「猜画小歌」。一经推出,立刻反响不凡,在微信朋友圈可谓是掀起了一股热潮。
用户1569917
2019/01/09
1.1K0
AI眼中的世界什么样?谷歌&OpenAI新研究打开AI视觉的黑箱
这个问题已经困扰研究人员数十年了,近年来这个问题变得更加紧迫。机器视觉系统被部署到生活的各个方面,从医疗健康到自动驾驶。但从机器的视角去「看」世界,去理解为什么它把一个目标归类为行人,而把另一个归类为路标,仍是一个挑战。无法克服这个挑战可能会带来严重甚至致命的后果。有些人会说这已经造成不良影响了,比如自动驾驶方面的事故。
机器之心
2019/03/15
6740
AI眼中的世界什么样?谷歌&OpenAI新研究打开AI视觉的黑箱
AI领域再出“王炸“----Claude3是否会成为下一个“神“
Claude 3 系列模型有三个版本:Claude 3 Haiku 轻便快捷、Claude 3 Sonnet 是技巧与速度的最佳结合以及性能最强大的 Claude 3 Opus。
一枕眠秋雨
2024/03/11
2860
AI领域再出“王炸“----Claude3是否会成为下一个“神“
研究 | 如何管教AI的行为举止?OpenAI早已开始研究,而这只是整个AI安全领域的前哨
AI 科技评论按:在比赛中刷成绩和在游戏中击败人类职业选手仅仅是 AI 研究的一部分,OpenAI 的研究人员们同样重视对 AI 安全性的研究。这篇文章是纽约时报来到 OpenAI 实验室的报道,介绍
AI科技评论
2018/03/13
8580
研究 | 如何管教AI的行为举止?OpenAI早已开始研究,而这只是整个AI安全领域的前哨
南方科技大学唐晓颖:如何利用粗略标注的图像自动检测眼底病变?
对于医学的任务而言,最重要的因素就是Big Data,而且是Big Good Data,数据的质量控制是非常重要的。唐晓颖团队的一个重要工作就是研究用自动化的方法对不精准的标注进行校正。
AI掘金志
2019/10/23
1.1K0
南方科技大学唐晓颖:如何利用粗略标注的图像自动检测眼底病变?
Meta开发新虚拟背景处理AI,让元宇宙中人像不再虚糊
自新冠疫情开始以来,大部分人都已经习惯了在和朋友、同事和家人远程视频通话。视频聊天的时候都使用过虚拟背景。
新智元
2022/02/24
6150
Meta开发新虚拟背景处理AI,让元宇宙中人像不再虚糊
太像人手了!OpenAI用打DOTA的算法,教会了机械手“盘核桃”
在OpenAI的实验室里,它缓缓 盘着核桃 转动着一个木块。没有人告诉它该动哪根指头,驱使它的,是在模拟器里训练出来的强化学习算法。
量子位
2018/08/08
4960
太像人手了!OpenAI用打DOTA的算法,教会了机械手“盘核桃”
【无监督学习】我们如何教人类婴儿学习,也如何教AI
【新智元导读】这篇文章讨论了在深度学习中为什么高质量、有标签的数据如此重要,从哪里得到这些数据,以及如何有效使用它们。作者最后提出,解决训练数据缺乏的方法可以是不去依赖它们,深度学习的未来可以朝着无监督学习的方向努力。 深度学习的一个主要组成部分是数据——用于训练神经网络的图像、视频、电子邮件、驾驶模式、话语、对象等等。 令人惊讶的是,尽管我们的世界几乎被数据淹没——目前每天产生约2.5万亿字节的数据,但大部分是没有标记或非结构化的,这意味着对当前大部分监督学习形式来说,这些数据是不可用的。深度学习尤其依赖
新智元
2018/03/23
8100
【无监督学习】我们如何教人类婴儿学习,也如何教AI
ChatGPT又添劲敌?OpenAI核心员工创业,新模型获一片叫好
机器之心报道 编辑:泽南、张倩 在 ChatGPT 巨人的肩膀上又有了改进。 ChatGPT 给 AI 领域带来的变革,可能正在催生一个新产业。上周末,有消息称 AI 初创公司 Anthropic 即将获得大约 3 亿美元的新融资。 Anthropic 由 OpenAI 前研究副总裁 Dario Amodei、GPT-3 论文一作 Tom Brown 等人在 2021 年共同创立,目前已筹集了超过 7 亿美元的资金,最新一轮的估值达到了 50 亿美元。他们开发了一种对标老东家知名产品 ChatGPT 的人工
机器之心
2023/03/29
3220
ChatGPT又添劲敌?OpenAI核心员工创业,新模型获一片叫好
26岁OpenAI举报人疑自杀!死前揭ChatGPT训练黑幕
曾在OpenAI工作四年,指控公司侵犯版权的Suchir Balaji,上月底在旧金山公寓中被发现死亡,年仅26岁。
新智元
2025/02/15
920
26岁OpenAI举报人疑自杀!死前揭ChatGPT训练黑幕
Dota之后,《王者荣耀》也被AI攻陷,势把人类顶级玩家拉下马
19日,腾讯AI Lab团队在arXiv上发表文章,训练AI大战人类玩家,而此次所选择的游戏,正是火遍大江南北的手游——《王者荣耀》。
昱良
2018/12/28
6390
抖音推荐、人脸解锁、游戏AI咋来的?聊聊机器学习三兄弟
这次我们就来介绍下AI学习相关的概念,主要是机器学习、深度学习、强化学习,当我们具备了这些基础的概念和知识,后期就可以利用AI工具更好的创造自己的东西了。
希里安
2025/03/31
1820
抖音推荐、人脸解锁、游戏AI咋来的?聊聊机器学习三兄弟
多模态图像版「GPT-3」来了!OpenAI推出DALL-E模型,一句话即可生成对应图像
最近,OpenAI官宣了一个基于Transformer的语言模型--DALL-E,使用了GPT-3的120亿参数版本。取名DALL-E,是为了向艺术家萨尔瓦多-达利(Salvador Dali )和皮克斯的机器人WALL-E致敬。
新智元
2021/01/11
1.4K0
多模态图像版「GPT-3」来了!OpenAI推出DALL-E模型,一句话即可生成对应图像
MIT新AI模型揭开黑匣子:使用透明的、类似人类的推理解决问题
如果向孩子呈现各种形状的图片,并要求他们找到大的红色圆圈,为了得出答案,可能经历几个推理步骤:首先,找到所有大的东西;接下来,找到大的红色的形状;最后,挑选出一个的大的红色圆圈。
AiTechYun
2018/09/26
5210
MIT新AI模型揭开黑匣子:使用透明的、类似人类的推理解决问题
推荐阅读
OpenAI DALL·E 3来了,集成ChatGPT,生图效果太炸了
9590
AI时代,陪孩子玩什么游戏?| 前Google资深工程师实战心法
7040
通俗易懂的目标检测 | RCNN, SPPNet, Fast, Faster
6850
DeepMind的AI学会了画画,利用强化学习完全不需人教
9180
大三少年造出AI写意画家,像人类一样挥笔作画丨已开源,有Demo
6220
7 Papers & Radios | OpenAI教GPT-3学会上网;爱因斯坦广义相对论通过严格检验
6240
AI小画手,说GAN就干!
1.1K0
AI眼中的世界什么样?谷歌&OpenAI新研究打开AI视觉的黑箱
6740
AI领域再出“王炸“----Claude3是否会成为下一个“神“
2860
研究 | 如何管教AI的行为举止?OpenAI早已开始研究,而这只是整个AI安全领域的前哨
8580
南方科技大学唐晓颖:如何利用粗略标注的图像自动检测眼底病变?
1.1K0
Meta开发新虚拟背景处理AI,让元宇宙中人像不再虚糊
6150
太像人手了!OpenAI用打DOTA的算法,教会了机械手“盘核桃”
4960
【无监督学习】我们如何教人类婴儿学习,也如何教AI
8100
ChatGPT又添劲敌?OpenAI核心员工创业,新模型获一片叫好
3220
26岁OpenAI举报人疑自杀!死前揭ChatGPT训练黑幕
920
Dota之后,《王者荣耀》也被AI攻陷,势把人类顶级玩家拉下马
6390
抖音推荐、人脸解锁、游戏AI咋来的?聊聊机器学习三兄弟
1820
多模态图像版「GPT-3」来了!OpenAI推出DALL-E模型,一句话即可生成对应图像
1.4K0
MIT新AI模型揭开黑匣子:使用透明的、类似人类的推理解决问题
5210
相关推荐
OpenAI DALL·E 3来了,集成ChatGPT,生图效果太炸了
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档