“机器翻译”是一个相对模糊的概念,大体上所有利用机器帮助人类进行翻译活动的技术和服务都可以归类为机器翻译。例如在线词典、翻译套件等,在广义上也可以称为机器翻译。现在绝大多数情况下,机器翻译指的是利用机器(电脑)进行完整的句子或篇章翻译的系统。在线词典等在这种定义下都被排除在外。大体上,机器翻译的发展可以分为一下几个阶段:早期探索时期(1933-1956);第一次热潮时期(1956-1966);商用的基于规则时期(1967-2007);统计机器学习时期(1993-2016);神经网络机器翻译时期,2013至今。
从机器翻译(Machine Translation)这个名词我们就可以看出这项技术有着悠久的历史——至少比电脑 (Computer)出现还要早。虽然人类很早就开始提出利用机器提供翻译服务,早期的提议大多停留在类似“文曲星”词典的快速词典查找设备上。直到1933年,俄罗斯人特洛伊斯基 (Peter Petrovich Troyanskii) 第一次提出了机器翻译模型,并在1937年展示了一个机器翻译系统。这个机器能够自动地找到句子中每个词的翻译——使用的是一种纸带存储设备。(题外:此君参与了苏联大百科全书的编辑,深感翻译不便的他全心投入翻译机器的设计,当然最后并没有成功)。
从这个时候开始,直到1949年机器翻译并没有太多的进展,特洛伊斯基的工作和大多数苏联的工作一样并不为西方世界所知。直到电子计算机的出现,机器翻译的可能性才为人们所重视。特别是Warren Weaver 的雄文《翻译》——是的,这份备忘录的名字就叫Translation。
然而从近30年的机器翻译发展来说,传统的语言学逐渐被移出机器翻译的核心算法,但是仍然扮演重要的角色,特别是在数据不足的情况下。在统计机器翻译时代,一些公司从语言学角度出发,在基于规则的方法上添加统计。而另一些公司则完全采用统计方法。从语言学出发的方法往往能在数据量小的情况下接近纯统计方法,然而当数据量大到一定程度,纯统计方法就快速占据上风。
在神经网络机器翻译时代,目前来看语法、语义等信息还没有较好的应用,虽然研究人员也在尝试,但是目前看来大多是incremental的小进展。
人工智能的威胁,对技术性工种的打击才最大。人工智能领域大佬们纷纷预测,初级医生、律师、工程师等岗位,将会是第一批被下岗的人才。未来职业被人工智能取代的可能性,将与这个职业当中所包含的人性要素水平直接相关。这也是为什么,我所从事的高级翻译工种,因技术占比更高,相对于J先生的这种人性占比更高的工种而言,会面临更大的威胁。
在智能翻译市场,针对学生外语学习的翻译产品一直都是一块刚需市场,例如曾经在中学生中十分流行的「文曲星」、「小霸王」。而针对旅游、商务跨文化交流方面,一直都因为应用场景的复杂性而依然以传统的人工翻译为主。
相信随着人工智能技术的发展,越来越多「聪明的」翻译类产品,将会出在我们的生活中,带给我们便利。
领取专属 10元无门槛券
私享最新 技术干货