我特意查了一下互联网上是如何来定义语料的,搜了半天,基本上没有符合我们翻译工作情况的。
从现代翻译服务行业的发展起源来说,最初提出翻译语料和术语的直接目的不是为了节约成本,而是为了提高翻译产品的质量。
举一个直观的例子,我们从小长到大,参加过很多考试,准备过很多资料,可是我们在填写自己的姓名、籍贯时,这些内容是没有变过的。即使你大名叫张三,小名叫狗子,外号叫麻子,甚至是更复杂的情况,但是,你在填写姓名时候,从来没有填写错误过。
随着大型跨国公司产品线的延长,产品以及产品型号的多样和大量出现,为了维持对外的统一形象,提高产品的识别度,这些客户公司在安排翻译工作的时候,要求翻译公司在翻译过程中保持产品名称、型号、口号等等的统一。
这样的工作对于客户公司本身也是非常重大和困难的,转移到翻译公司身上,困难也是依旧存在。现在客户公司安排工作时候一样会说:“注意用词统一,保证质量“。翻译公司为了”用词统一、保证质量“借助了计算机技术,所以有了翻译辅助工具商。
说到这里,我们可以说术语、语料是翻译工作中的副产品,是一个意外的发现。类似于伟哥一样,让某些人为之一振。
受限于当时计算机硬件技术方面的限制,最初术语、语料保存到方便计算机读取和人类阅读的txt等纯文本编辑文件中,后来常见的保存方式是Excel 表格文件。再后来,计算机技术飞速发展,翻译辅助工具的性能和功能有了提升,为了提高工作效率,快速的从上万条Excel文件中快速的检索出有用的信息,就出现了只能工具能读取的文件版式。
有 access 数据库格式、dat 数据库格式,mix数据库格式,以及现在命名比较清晰,富含翻译行业特点的sdltm格式等。TM 就是 Translation Memory 的缩写,也就是翻译记忆库。
翻译记忆库是对于我们从业者来说有用的语料。在翻译记忆库中保存的是一句原文对应一句译文的句段。在翻译行业发展长河中,我们称之为“翻译单元“,缩写为TU, Translation Unit。另外翻译记忆库的一句和我们日常生活中的一句也不一样。可能我们日常生活中的一句话,在翻译辅助工具中,会被分成好几个”断句“也就是它们的 Segment。目的是为了迁就计算机软件能识别并读取内容。
如果我们在翻译工作中,积累了大量的,高质量的翻译记忆库,不仅可以提高我们翻译产品的质量,还能提高我们单位时间的产量。
这样的技术在二三十年前已经基本成熟。但是,也只是近一两年一些翻译公司为了迎合资本的需要,实现快速发展,借助计算机硬件技术的突破,将这个二三十年成熟的技术包装成为所谓的“智能翻译“,来欺世盗名,妖言惑众。
不要说二三十年,就是十来年前,计算机的内存才128MB,512MB,现在我们的计算机没有8G内存,都不好意思开机。
“智能翻译“如果只是表现在搜索快,只能是自欺欺人。
所以,我怼某些同行,不要扯着蛋。
领取专属 10元无门槛券
私享最新 技术干货