AI翻译一直是人工智能领域关注较多和技术讨论较多的方向,而在全球范围内,谷歌的智能翻译一直占据的重要的地位,这有赖于谷歌对于翻译的另类理解和技术提升,今天我们就来看看谷歌为了翻译都做了什么。
翻译的理解
“翻”是指的这两种语言的转换,即先把一句甲语转换为一句乙语,然后再把一句乙语转换为甲语;“译”是指这两种语言转换的过程,把甲语转换成乙语,在译成当地语言文字的过程中,进而明白乙语的含义。二者构成了一般意义上的翻译,让更多人了解其他语言的含义。
而AI翻译并不具备这个思考的过程,如果一门语言可用的文字资料越多,经过人工智能模型训练出来的翻译效果就越好。但是这是最理想的状态,谷歌的特别之处就是,如何在数据不多的情况下,训练出更好的翻译器。
混合模型和数据挖掘
混合模型指的是由Transformer编码器和递归神经网络(RNN)解码器构成的模型。而翻译质量的提高主要是依靠编码器,因此谷歌对RNN解码器进行了优化,使得RNN解码一代比一代强。
数据挖掘,我们比较清楚的就是爬虫工具。爬虫工具可以从数以百万计的示例翻译中收集编译训练数据。升级后,谷歌嵌入了14 种大语言对,而不是单纯基于字典数据。简单来说,就是谷歌翻译更多地聚焦于精确性,而非检索的数量。
AI智能翻译
很多人说,AI智能翻译就是翻译的终结者,未来不需要翻译者,有AI就可以了。但是谷歌表示,AI翻译在将一种语言的不同方言混合在一起的时候,就会产生太多的直译,还有就是在特定主题,非正式或口语上的表现也是经常出现问题的,所以AI 取代人工翻译路途尚远。
所以AI翻译与其说是在提高机器对于翻译的效率,还不如说是人类对自己的了解的过程。大家关于谷歌AI翻译还有什么想说的,可以关注并留言给科技猫。
领取专属 10元无门槛券
私享最新 技术干货