Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >BERT的逆袭:揭秘如何在无需额外训练下释放语言模型的生成能力

BERT的逆袭:揭秘如何在无需额外训练下释放语言模型的生成能力

作者头像
zenRRan
发布于 2024-06-18 09:00:44
发布于 2024-06-18 09:00:44
1940
举报

论文:BERTs are Generative In-Context Learners链接:https://arxiv.org/pdf/2406.04823

1. 这篇文章想解决什么问题?

文章探讨了掩码语言模型(MLMs,例如BERT和DeBERTa)在上下文学习(in-context learning)方面的能力,挑战了普遍观点,即这种能力在这些模型中不会“显现”。作者意图证明,即使没有额外的训练,MLMs也能够展现出与著名的GPT-3相当的生成能力。

2. 论文用什么方法解决什么问题?

  • 论文提出了一种简单的推理技术,使得DeBERTa能够在没有任何额外训练的情况下作为生成模型运行。
  • 通过修改输入令牌序列的方式,使得预训练的掩码语言模型能够用于文本生成和文本排名任务,而不需要进行额外的训练或微调。
  • 论文还探讨了掩码语言模型和因果语言模型在不同任务类别上的表现差异,并提出了混合训练方法的潜力。

3. 论文做了哪些实验?

  • 作者使用DeBERTa模型,并将其与GPT-3进行了比较分析,涵盖了多种自然语言处理(NLP)任务,包括语言理解、语言建模、机器翻译和问答。
  • 实验包括了对不同规模的DeBERTa模型(从0.1B到1.4B参数)在单次(1-shot)学习情况下的表现进行了评估。
  • 还包括了“针堆中找针”(needle in a haystack)的测试,以评估模型对长序列的泛化能力。

4. 论文或者方法有哪些局限性,未来工作是什么?

  • 局限性包括:
    • MLMs在实际应用中由于不能缓存中间自注意力的键和值向量,因此在时间复杂度和内存复杂度上存在限制。
    • 在机器翻译任务中,DeBERTa的表现不如GPT-3,部分原因可能是由于其训练语料库相对较小且干净,缺乏多语言数据。
    • 在闭卷问答任务中,MLMs的表现较差,这可能与它们在训练期间能够从丰富的上下文中检索世界知识有关,而不需要将知识存储在学到的权重中。
  • 未来工作可能包括:
    • 通过在更大和更多样化的文本语料库上预训练、增加模型参数数量和使用更长的上下文长度来提高DeBERTa的结果。
    • 探索将因果语言建模与掩码语言建模的优势结合起来的混合模型,以实现更好的上下文学习能力。

> kimi+人工共同完成。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-06-12,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 深度学习自然语言处理 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Unity零基础到入门 ☀️| 学会这些Unity常用组件,Unity中必备组件技能学习!
⭐️组件Component ????前言 ????简介 ????Unity工程结构 ????几种常用组件介绍 ????Transform组件 ????Mesh Filter(网格过滤器)和Mesh R
呆呆敲代码的小Y
2021/08/20
3.3K0
Unity零基础到入门 ☀️| 学会这些Unity常用组件,Unity中必备组件技能学习!
【Unity3D】Unity 脚本 ① ( 创建 C# 脚本 | Visual Studio 2019 中打开 C# 脚本 | 编译 C# 脚本 | 挂载 C# 脚本到游戏物体 | 运行脚本 )
在 Project 窗口中的 Assets 目录下 , 创建 Scripts 目录用于存放 C# 脚本 ;
韩曙亮
2023/03/30
4.7K0
【Unity3D】Unity 脚本 ① ( 创建 C# 脚本 | Visual Studio 2019 中打开 C# 脚本 | 编译 C# 脚本 | 挂载 C# 脚本到游戏物体 | 运行脚本 )
【Unity+C#】Unity手把手入门基础演示,并实现一个翻滚的球球小游戏
先安装好Unity环境,此步骤省略。目前我安装两个Unity编辑器,一个是最新版2023.1.x,一个是最新LTS版本的2022.3.x
Wesky
2024/08/27
6510
【Unity+C#】Unity手把手入门基础演示,并实现一个翻滚的球球小游戏
Unity Demo教程系列——Unity塔防游戏(三)塔(Shooting Enemies)
这是有关创建简单塔防游戏的系列教程的第三部分。它涵盖了塔的创作以及它们如何瞄准和射击敌人。
放牛的星星
2020/12/11
2.6K0
Unity Demo教程系列——Unity塔防游戏(三)塔(Shooting Enemies)
Unity Mesh基础系列(四)mesh变形(制作一个弹力球)
这篇教程是基于上一篇 立方体球 的。它复用了同一个网格,并在此基础上做增加更多的测试模型。本示例适用于Unity5.0.1及以上版本。
放牛的星星
2020/08/28
4K0
Creator3D案例新作,守护你的球球
http://example.creator-star.cn/follo-ball/
张晓衡
2019/10/22
6160
Creator3D案例新作,守护你的球球
Unity Mesh基础系列(一)生成网格(程序生成)
本教程假设你已经熟悉Unity Scripting的基本知识了。如果不清楚的可以看 时钟 的章节学习Unity的基础知识。而 构建分形 的章节里也提供了协程的基本介绍。
放牛的星星
2020/08/21
10.8K0
Unity Mesh基础系列(一)生成网格(程序生成)
Unity【Colliders碰撞器】和【Rigibody刚体】的应用——小球反弹效果
一、给地板floor添加碰撞器,这里我们不添加刚体Rigibody,因为会使地板因为重力而下落。
用户11315985
2024/10/16
5780
Unity【Colliders碰撞器】和【Rigibody刚体】的应用——小球反弹效果
【Unity】手把手入门2D游戏开发教程——小狐狸的冒险(上)
‍前言:本文章教程,结合Unity官方教程和网上其他资源教程进行整合,目的是让大家可以更快速地上手,减少大家观看比较理论的教程或者视频时长偏长的教程的时间。‍‍‍‍‍
Wesky
2024/09/19
6350
【Unity】手把手入门2D游戏开发教程——小狐狸的冒险(上)
Unity基础系列(一)——创建一个时钟(GameObjects与Scripts)
这篇教程是一个基础教程,会和大家一起创建一个简单的时钟,并且给它加上一些组件脚本用来显示当前时间。这篇教程的意义并不在于怎么学会写出一个时钟,而是教你认识Unity的编辑器。当然如果你之前已经接触过或者用过Unity了并且能自己找到场景窗口,那么就算是有个很好的开始了。
放牛的星星
2020/07/15
2.5K0
Unity基础教程系列(十二)——更复杂的关卡(Spawn,Kill,and Life Zones)
这是关于对象管理系列的第12篇也是最后一篇教程。它涵盖了kill区域的增加和更严格的关卡对象管理。
放牛的星星
2020/10/30
1.8K0
Unity基础教程系列(十二)——更复杂的关卡(Spawn,Kill,and Life Zones)
Creator3D图文教程【打砖块】终于撸出来了,附送最新源码!
上面图中是打砖块游戏的主要 3D 节点元素,Shawn这两天在学习 Unity 与 Creator3D 感受到制作 3D 游戏与 2D 游戏最大的不同是 3D 游戏是在模拟一个真实世界,下面我打砖块游戏场景中的主要 3D 节点做个简要说明。
张晓衡
2019/10/10
1.2K0
Creator3D图文教程【打砖块】终于撸出来了,附送最新源码!
如何用python制作3d游戏_【教程】12个步骤让你快速学会制作3D游戏
Unity3D不仅是一款功能强大且易于上手的游戏引擎,更重要的是,它还可以被免费下载(它还有一个功能更强大的付费版,但其实你可以使用免费版本完成绝大部分工作)。
全栈程序员站长
2022/09/02
3.9K0
Unity基础教程-物体运动(九)——游泳(Moving through and Floating in Water)
很多游戏都有水,并且大都是可以游泳的。然而,对于交互式水没有现成的解决方案。PhysX并不直接支持它,所以我们必须自己创造一个水的近似值。
放牛的星星
2020/11/25
2K0
Unity基础教程-物体运动(九)——游泳(Moving through and Floating in Water)
unity3d的入门教程_3D网课
一、Unity下载与安装 参考博客:Unity Hub、unity、PlasticSCM安装
全栈程序员站长
2022/09/22
4.3K0
Godot3游戏引擎入门之一:熟悉编辑器界面
2018-09-03 by Liuqingwen | Tags: Godot | Hits
IT自学不成才
2019/01/08
1.2K0
Unity基础系列(二)——构建一个视图(可视化数学)
在本章教程中,我们将使用游戏对象来构建一个图形,这样我们就可以把数学公式用图像展示出来。然后再把函数和时间关联起来,从而产生一个运动的图像。
放牛的星星
2020/07/16
2.9K1
Unity基础教程-物体运动(七)——移动地面(Going for a Ride)
这是有关控制角色移动的教程系列的第七部分。它解决了在运动中的地形上站立和导航的问题。
放牛的星星
2020/11/25
2.3K0
Unity基础教程-物体运动(七)——移动地面(Going for a Ride)
通过C#脚本实现旋转的立方体
一、介绍 目的:通过一个简单的例子(鼠标点击,使立方体旋转和变色)熟悉Unity中C#脚本的编写。 软件环境:Unity 2017.3.0f3 、 VS2013。 二、C#脚本实现 1,启动Unity
Zoctopus
2018/06/04
1.8K0
Unity引擎与C#脚本简介
本文基于 Unity 游戏开发引擎,主要会讲两部分内容:第一部分简单讲讲游戏开发的原理,第二部分会聊聊 Unity 的 C# 游戏脚本。
小时光
2018/03/01
4.8K3
Unity引擎与C#脚本简介
推荐阅读
Unity零基础到入门 ☀️| 学会这些Unity常用组件,Unity中必备组件技能学习!
3.3K0
【Unity3D】Unity 脚本 ① ( 创建 C# 脚本 | Visual Studio 2019 中打开 C# 脚本 | 编译 C# 脚本 | 挂载 C# 脚本到游戏物体 | 运行脚本 )
4.7K0
【Unity+C#】Unity手把手入门基础演示,并实现一个翻滚的球球小游戏
6510
Unity Demo教程系列——Unity塔防游戏(三)塔(Shooting Enemies)
2.6K0
Unity Mesh基础系列(四)mesh变形(制作一个弹力球)
4K0
Creator3D案例新作,守护你的球球
6160
Unity Mesh基础系列(一)生成网格(程序生成)
10.8K0
Unity【Colliders碰撞器】和【Rigibody刚体】的应用——小球反弹效果
5780
【Unity】手把手入门2D游戏开发教程——小狐狸的冒险(上)
6350
Unity基础系列(一)——创建一个时钟(GameObjects与Scripts)
2.5K0
Unity基础教程系列(十二)——更复杂的关卡(Spawn,Kill,and Life Zones)
1.8K0
Creator3D图文教程【打砖块】终于撸出来了,附送最新源码!
1.2K0
如何用python制作3d游戏_【教程】12个步骤让你快速学会制作3D游戏
3.9K0
Unity基础教程-物体运动(九)——游泳(Moving through and Floating in Water)
2K0
unity3d的入门教程_3D网课
4.3K0
Godot3游戏引擎入门之一:熟悉编辑器界面
1.2K0
Unity基础系列(二)——构建一个视图(可视化数学)
2.9K1
Unity基础教程-物体运动(七)——移动地面(Going for a Ride)
2.3K0
通过C#脚本实现旋转的立方体
1.8K0
Unity引擎与C#脚本简介
4.8K3
相关推荐
Unity零基础到入门 ☀️| 学会这些Unity常用组件,Unity中必备组件技能学习!
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档