不知不觉,葫芦娃的术语学心得分享已经接近尾声。不知道大家是否有所获呢?
本文介绍的是《术语管理手册》第八章,也是最后一章的内容——术语学在计算机领域的应用。
本章主要从数据库管理方法(如何对术语管理程序标准进行评估),与数据库相关的应用程序和产品,机器翻译(MT)系统下的术语管理,语料库相关的应用程序以及网络上的术语资源等五个方面,详细阐释术语学如何与计算机技术进行结合,从而解决实际问题。
以下,葫芦娃选取了四个有意思的点来和大家分享。
- LET'S GO -
本文主要框架
1
信息技术向术语管理过程的渗透
随着信息技术的高速发展,术语管理中也越来越多地应用信息技术。
术语的概念表示
信息技术拥有丰富的表示方法,能够动态多维地进行概念的表示。
*术语的定义:人工智能技术中对知识建模方面的研究有助于创建真正的、更加协调系统的术语定义。
*术语语境的挑选:机器辅助进行语境检索能够大大节省录入时间,目前语境自动化选择的研究正在如火如荼地进行中。
*计算机辅助绘图模块:可以对概念体系的表示提供理性的工具和模型,为概念体系的构建提供更多图形细节、更具灵活性。计算机能够对概念进行分析,从而更加方便地构建术语知识库。
语言资产管理
术语管理亦可与语言资产管理相结合。语言资源中使用的信息技术也可以应用到术语管理中来。
* 在计算机辅助翻译(CAT)工具中,术语库可帮助译员迅速地定位某一术语的译法,从而保证翻译内容的一致性。
* 此外,术语管理也可以与语料库管理相结合,利用电子语料库中的大量语料数据和统计分析模型,辅助术语提取和转换工作。
软件提取术语的发展现状
2
软件提取术语的工作基于语料库完成,利用专业文本中词汇密度高、名词化程度高等特点,在基于特定的规则和算法的基础上,借助词频统计、上下文关键词检索等方法进行术语提取。
但是,由于语言中一词多义、术语化、省略、变体等现象的存在,以及术语界限的划分问题,用软件进行术语提取工作到现在仍然不够成熟,特别是涉及到词组类的术语时,用软件识别术语的准确率会大大下降。
下图为memoQ中基于文本【国际冰联竞赛规则2014-2018】进行术语提取的依据及结果:
可以看出,由于软件仅依据长度和频率提取术语,不涉及具体的语法等规则,因而提取的结果中可能出现不完整词语「门员」或其他词性的词语「如果」,降低了术语提取的准确度。
尽管如此,软件提取术语的工作仍有其价值所在:
* 在有限的时间内从大量文本中提取术语时,机器提取术语能够降低人力劳动和时间金钱成本;
*筛选术语的过程可能因大量重复工作而出现一些固定的模式,人工浏览时往往会忽视这些固定模式,而机器则可以进行统计识别,作为一部分补充。
值得注意的是:由于目前软件提取术语的准确性并不高,现有的术语提取系统都必须经由人工筛选和处理确认才可以使用,因而将软件提取术语的这一工作称为“候选术语提取”才是更加准确的说法。
3
用户的使用体验
术语库的建设旨在为用户服务,因此用户体验是交互关系的重点。
术语库建设过程中必须始终坚持用户友好原则,需要考虑:
* 术语的条目结构及所含内容是否符合用户的需求
* 术语库的用户界面是否易操作
* 用户所需的数据类别是否都清楚地排布在界面上
在设计检索功能时,要考虑到不同的检索方式都应尽可能满足用户的检索需求。
在力求满足用户需求的同时,还需注意:
术语专家和其他建设人员本身的术语需求和对术语的理解不同于用户。比如说,术语专家熟悉的基础术语可能是用户并不了解的。
因此,在术语库的建设过程中要督促提醒大家从用户的角度考虑,提高术语库的可用性。
随着互联网及电子资源的广泛应用,术语平台的用户增加,术语库中非文字的表现形式也呈增加趋势,使术语的展现形式更加直观、多维,利于用户理解。这一点也是术语库为提高用户体验而增加的改变。
全球化和术语管理
4
成功的企业全球化需要有全面的、跨区域的术语管理策略。
对于企业来说,订立术语管理标准有诸多好处:
* 可以在所有语言中使用一致的源术语,消除反复研究和开发术语表的需要;
* 术语数据直接从开发中心传递到翻译中心,消除翻译中心对源语言术语的重复研究;
……
图片来源:https://www.idcs.cn/view-2543
成功案例
IBM是全球最大的技术翻译采购方之一,拥有庞大的术语资产,在各地的翻译中心都开发了当地的双语术语库,由公司员工进行维护。
* 对于翻译过程而言,IBM公司首先会让多位开发人员和作者共同参与制作一个产品的英文版本,再将英语翻译成其他语言。这种将英语作为中心语言的做法能够在很大程度上保证翻译的质量,因为很多翻译错误可能并不是在翻译过程中产生的,而是源文本就已经有了问题,因此,企业在全球化的过程中进行产品翻译时,需要注意源文本的正确性和术语一致性。
IBM还开发了自己的翻译友好工具IDWB。在翻译工作中,需要由术语专家为翻译工具编写双语项目字典,供翻译人员参考使用。
* IBM在各地的开发实验室和翻译中心都在进行创新实践。通过评估这些实践,可以在全球范围内应用较为高效的实践,将类似的流程和工具应用到类似情景中去,从而节约成本,不断优化公司的实践流程,通过使用最佳实践,实现收益最大化。
此外,由于不同的术语集有不同的属性和结构,因而彼此之间及某些文本处理工具之间可能存在不兼容的情况。目前IBM正在研究合并术语集的方法。
结语
全体葫芦娃祝大家国庆假期愉快
更重要的是...
祝韩老师新婚快乐
- END -
下面依然是精彩的葫芦娃介绍环节▼
●●●
本作品采用知识共享署名-非商业性使用
4.0 国际许可协议进行许可
内容提供:
朱莹、庞智、渠杰琪、汤秋颖、袁小惟
整理:金灵 |排版:金灵
●●●
7ocalization
本地化丨语言服务丨MTI
领取专属 10元无门槛券
私享最新 技术干货