前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >对预训练语言模型中跨语言迁移影响因素的分析

对预训练语言模型中跨语言迁移影响因素的分析

作者头像
zenRRan
发布于 2022-09-27 08:30:42
发布于 2022-09-27 08:30:42
87200
代码可运行
举报
运行总次数:0
代码可运行

作者:李加贝 方向:跨模态检索 链接:https://zhuanlan.zhihu.com/p/556921577

ACL'20: Emerging Cross-lingual Structure in Pretrained Language Models

这篇论文发表在ACL’20,作者研究了多语言掩码语言建模问题,并详细研究了影响这些模型对跨语言迁移的几个有效因素

task:

  • natural language inference (NLI),
  • named entity recognition (NER)
  • dependency parsing (Parsing).

剖析mBERT/XLM模型

域相似性

域相似性(Domain Similarity)已被证明会影响跨语词嵌入的质量,但是这种效应对于掩码语言模型并没有很好地建立起来。

在Wikipedia上训练英语,在同样大小的Wiki-CC的一个随机子集上训练其他语言。在XNLI和Parsing上下降了两个点左右,在NER上下降了6个点左右。一个可能的原因是,NER的标签WikiAnn数据由维基百科文本组成;源语言和目标语言在预训练的域差异更会影响性能。对于英文和中文的NER,都不是来自维基百科,性能只下降了大约2分。

Anchor points

Anchor points就是说在不同语言中都会出现的相同字符串,例如 DNA和Paris。Anchor points的存在被认为是有效的跨语言迁移的关键因素,因为它们允许共享编码器在不同语言之间至少有一些直接的意义捆绑,然而这个影响却没有被仔细衡量过。

更多的Anchor points会有帮助,尤其是在关系不太密切的语言对中(例如中-英)。default和no anchor相比,影响并不是很大,总的来说,这些结果表明,我们之前高估了Anchor points在多语言预训练中的作用。

参数共享

Sep表示哪些层不是跨语言共享的。随着共享层的减少,性能逐渐下降,而且关系不太密切的语言对也会下降更多。最值得注意的是,当分离嵌入和Transformer的底6层时,跨语言迁移的性能下降到随机。然而,在不共享底三层的情况下,仍然可以实现相当强的迁移能力。这些趋势表明,参数共享是学习有效的跨语言表示空间的关键因素。模型对于不同语言的学习是相似的,模型可以通过对学习跨语言具有相似含义的文本表示进行对齐来减少它们的模型容量。

BERT模型的相似性

单语言BERTs对齐

使用该方法来衡量相似度,X和Y表示单语言Bert的输出特征

Word-level对齐

对单语言bert的对齐能力进行实验,使用双语词典MUSE benchmark来监督对齐,并评估单词翻译检索的对齐。

使用更高层的上下文特征的对齐能力比低层的要好

上下文word-level对齐

研究表明,对齐单语言模型(MLM对齐)获得了相对较好的性能,尽管它们的性能不如双语MLM,除了英语法语解析。单语对齐的结果表明,我们可以通过一个简单的线性映射对单语BERT模型的上下文进行对齐,并将这种方法用于跨语言迁移。模型在中间层取得了最好的迁移对齐性能,而不是最后一层。与解析相比,单语言MLM对齐和双语MLM在NER方面的性能差距更高,这表明解析所需的语法信息通过简单的映射对齐较为容易,而实体信息则需要更显式的实体对齐

Sentence-level对齐

图6显示了采用最近邻搜索和余弦相似度的句子相似度搜索结果。在较低层取得了最好的结果。作为参考,LASER(用数百万个平行句子训练)取得了更好的性能结果。

这些发现表明,词汇级、上下文词汇级和句子级BERT特征都可以用一个简单的正交映射进行对齐。类似于词嵌入对齐(Mikolov et al., 2013),这表明BERT模型在不同语言之间是相似的。这个结果更直观地说明了为什么仅仅共享参数就足以在多语言掩码语言模型中形成多语言表示。

神经网络相似性

使用下述公式来衡量单语言模型的跨语言相似度

CKA similarity

对于单语和双语模型,前几层具有最高的相似性,这解释了为什么之前的工作发现冻结mBERT底层有助于跨语言迁移。换句话说,当语言相似时,使用相同的模型会增加表示的相似性。另一方面,当语言不同时,使用相同的模型对表示相似性没有太大帮助。未来的工作可以考虑如何最好地训练涵盖远亲语言的多语言模型

总结

  1. 在只有一些Transformer层的参数共享的情况下,可以从无监督的多语言掩码语言模型中生成多语言表示。
  2. 即使没有任何anchor points,模型仍然可以学习在一个共享的嵌入空间中映射来自不同语言的特征表示
  3. 在不同语言的单语掩码语言模型中出现了同构嵌入空间,类似于word2vec嵌入空间
  4. 通过使用线性映射,能够对齐用不同语言训练的Transformer的嵌入层和上下文特征。
  5. 作者使用CKA神经网络相似性指数来研究BERT模型之间的相似性,并表明Transformer的底层比最后层的跨语言相似度更高
  6. 所有这些影响在关系更密切的语言中更强,这表明在距离更遥远的语言对中有显著改进的空间。

📝论文解读投稿,让你的文章被更多不同背景、不同方向的人看到,不被石沉大海,或许还能增加不少引用的呦~ 投稿加下面微信备注“投稿”即可。

最近文章

为什么回归问题不能用Dropout?

Bert/Transformer 被忽视的细节

中文小样本NER模型方法总结和实战

一文详解Transformers的性能优化的8种方法

DiffCSE: 将Equivariant Contrastive Learning应用于句子特征学习

苏州大学NLP团队文本生成&预训练方向招收研究生/博士生(含直博生)

代码语言:javascript
代码运行次数:0
运行
复制

投稿或交流学习,备注:昵称-学校(公司)-方向,进入DL&NLP交流群。

方向有很多:机器学习深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱语音识别等。

记得备注~

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-09-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 深度学习自然语言处理 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
vue前端怎么导出图片_VUE中将页面导出为图片或者PDF
1.将页面html转换成图片 npm install html2canvas –save
全栈程序员站长
2022/09/01
2.8K0
html2canvas - 项目中遇到的那些坑点汇总
因为css里的只是展示画布显示的大小,不像这样是canvas真正的内里图画分辨率的大小。
xing.org1^
2020/06/29
4.7K0
带你领略 html2canvas
如果你希望排除某些元素被渲染,你可以添加data-html2canvas-ignore属性到这些元素,html2canvas将从渲染中排除它们。
公众号---人生代码
2020/11/19
1.8K0
带你领略 html2canvas
# 浏览器截图方案分析
html2canvasopen in new window 用的比较广泛的前端截图方案,先将 DOM 一个个 转为 Canvas 然后导出图片(使用 canvas 自带的 toDataUrl、toBobl)即可。使用起来应该是兼容性比较好的方案了,能解决大部分的需求,但是也有一写小问题,如:
九旬
2023/10/19
5210
Web动态图片合成与分享——html2canvas方案实践
在web侧运营活动中,分享传播是重要的一环。普通的h5链接/结构化消息分享已经不能满足产品越来越大的脑洞。在很多场景下,我们需要将个性化内容(如帐号信息,头像,用户输入等)固化为一张完整的图片,一秒分享到朋友圈&AIO&群,藉此提高传播效率。
WendyGrandOrder
2018/10/19
8.5K2
Web动态图片合成与分享——html2canvas方案实践
【前端探索】移动端H5生成截图海报的探索
移动端H5生成图片海报分享,是比较常见的交互方式。生成的海报中,往往会有用户的个性化信息,比如头像、昵称等等。
luciozhang
2023/04/22
8080
vue中使用html2canvas及解决html2canvas截屏图片模糊问题
html2canvas  官方网站http://html2canvas.hertzen.com/index.html
lin_zone
2018/08/15
7.9K0
get两个js小技能——JS截取视频第一帧&图片转Base64
背景 由于开发之前做的VisualDrag拖拽模板优化的时候,拖拽进去的图片、视频文件等需要进行截图作为封面,目前采用的截图方法是htme2canvas,使用canvas进行的截图操作,所以就会遇到这样的问题,视频和图片图床简单的使用标签加入canvas画布里面无法正确的截图成功。最后采取的措施就是将图片转为base64画入canvas,将视频截取第一帧图片,然后画进canvas,最后进行截图,最后经过折腾,这个方法好像成功了,写这篇博客进行记录下。 JS截取视频第一帧 截取视频的第一帧作为视频的封面
不愿意做鱼的小鲸鱼
2023/03/23
7.1K0
get两个js小技能——JS截取视频第一帧&图片转Base64
浅谈两种前端截图方式:Canvas截图 vs SVG截图
如今很多网站都引入截图功能,可用于问题反馈、内容分享等实用需求,而前端截图也不知不觉成为了首选。今天为大家推荐两种前端截图方式,虽然有些局限,但是也能应付大部分项目需求。
JowayYoung
2020/04/01
14.2K2
html2canvas - 解决办法之图片跨域导致的截图空白
1. 后端支持:图片要是cdn上的地址,并且允许图片跨域,header头中设置应为   Access-Control-Allow-Origin:  * 2. 前端配置 1 var opts = { 2 scale: scale, // 添加的scale 参数 3 canvas: canvas, //自定义 canvas 4 logging: false, //日志开关,便于查看html2canvas的内部执行流程 5 w
xing.org1^
2018/05/17
2.9K0
使用 html2canvas 生成分享图片,CDN图片不展示问题
生成分享图片,包含后端返回的图文,图片是 cdn 资源。开始尝试使用 html2canvas 时,使用的是本地图片,生成截图无问题。
用户10106350
2022/10/28
2.1K0
Vue 一键导出 PDF
生成 PDF 基本思路大多一致,先用 html2canvas 将 DOM 元素转换为 canvas,再利用 canvas 的 toDataURL 方法输出为图片,最后使用 jsPDF 添加图片生成 PDF 实现一键下载。
数媒派
2022/12/01
1.9K0
uniapp页面截长图,并非手机自带截图
手机截图只能获取当前页面可视区域的内容,如果我想将整个页面包括溢出屏幕的保存为图片。
英曼畅学
2023/04/18
2.5K0
Vue 结合html2canvas和jsPDF实现html页面转pdf
E:\MyProjects\TMP\frontend>npm install html2canvas
授客
2020/04/30
5K0
Vue 结合html2canvas和jsPDF实现html页面转pdf
【Web技术】929- 前端海报生成的不同方案和优劣
首页测试demo:https://html2canvas.hertzen.com/
pingan8787
2021/04/26
1.6K0
【Web技术】929- 前端海报生成的不同方案和优劣
前端生成pdf,jspdf+html2Canvas的使用(vue)
2、安装html2Canvas: npm install --save html2canvas
前端小tips
2021/11/27
7.9K0
前端生成pdf,jspdf+html2Canvas的使用(vue)
微信刷屏的「给我一面国旗」如果要做到,技术原理是什么?
https://developers.weixin.qq.com/doc/offiaccount/OA_Web_Apps/Wechat_webpage_authorization.html
养码场
2019/09/26
7560
微信刷屏的「给我一面国旗」如果要做到,技术原理是什么?
【架构师(第五十二篇)】 几个前端工具的基本使用
设备像素也被称为物理像素,是显示设备中一个最微小的物理部件,在同一设备中,物理像素的总数是固定的。
一尾流莺
2022/12/10
4170
为博客页面添加海报分享功能
以前浏览别的博主网站的时候总会在文章页末看到或多或少一些分享功能,比较常见的都是些社交平台的按钮,当时想的是功能虽好可有多少人会去用啊?心想嘛就是个摆设还不如不要占位置233
2Broear
2024/03/12
2130
【Web技术】1528- 来自大厂前端页面截图方案
将网页保存为图片(以下简称为快照),是用户记录和分享页面信息的有效手段,在各种兴趣测试和营销推广等形式的活动页面中尤为常见。
pingan8787
2023/02/13
3.2K0
【Web技术】1528- 来自大厂前端页面截图方案
推荐阅读
相关推荐
vue前端怎么导出图片_VUE中将页面导出为图片或者PDF
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档