AiTechYun
编辑:nanan
微软本周三宣布,他们已经创造出了第一台机器翻译系统,能够以与人一样的准确度将新闻稿件从中文翻译成英文。该公司表示,他们对该系统进行了反复的测试,从各种网络报纸上收集了大约2000句话,并将结果与个人翻译过程进行比较,甚至还聘请了双语的语言顾问来进一步验证这台机器的准确性。
这个名为newstest2017的样本集是去年秋天在WMT17的研究会议上发布的。
那么,令人惊讶的是,研究人员能够多快实现这一里程碑——尤其是考虑到机器翻译是人们几十年来一直试图解决的问题。
微软指出,许多人甚至认为人类平等的目标永远不会实现。
在微软的博客中,负责微软语音、自然语言和机器翻译工作的技术人员黄学东表示:“在机器翻译任务中,实现人类的平等是我们所有人都梦寐以求的。我们只是没想到我们能这么快就击中它。”
在这种程度上让机器理解语言要比语音识别复杂得多——这是近年来出现的一些进步。人工智能和语音识别技术的进步使得语音助手能够在我们的智能手机和家庭中找到方法,帮助消费者处理日常的计算任务,控制智能家居设备,以及新闻和娱乐的目的。
但是,要求对网页或新闻文章进行机器翻译仍常常会出现同样难以理解的单词混乱,充其量只能让你大致了解所讲的内容,但几乎不可能深层次的理解。
要真正理解文章中所说的内容,你需要一个人的帮助。
但即使是不同的人工翻译,也可以用一种稍微不同的方式翻译一个句子。
“机器翻译比单纯的模式识别任务复杂得多,”微软亚洲研究院副总裁兼自然语言处理组负责人周明表示,“人们可以用不同的词语来表达完全一样的东西,但你不能说哪一个更好。”
微软也注意到,最近在人工智能领域的突破有助于研究人员实现这一里程碑。
深度神经网络是一种训练人工智能系统的方法,使研究人员能够创造出更流畅、更自然的翻译,将更广泛的背景考虑进来,即所谓的统计机器翻译。
微软的研究人员还将他们自己的训练方法添加到系统中,以提高其准确性——这些方法等同于人们如何利用自己的工作时间,并确保它是正确的。
研究人员表示,他们使用的方法包括:双重学习的事实检查翻译; 审议网络,重复翻译和改进; 以及联合培训等新技术,以迭代方式促进英汉翻译系统和中英文翻译系统; 和协议正规化,可以通过从左到右和从右到左阅读句子来生成翻译。
周明说道,实现这一里程碑的技术不会局限于机器翻译。
“这是一个机器翻译研究可以应用到人工智能研究领域的领域,”周明表示。
此外,它可以在将来使用其他语言实现更准确和自然的翻译。
研究人员警告说,该系统还没有在实时新闻报道上进行测试,而且在这项技术被商业化到微软的产品之前还有其他的挑战。
但是你可以尝试新的翻译系统在微软的网站:https://translator.microsoft.com/neural(该网站警告称,有时可能运行得较慢)。
该系统将以中文(简体)显示一个句子,然后翻译成两种方式,并以更完善的翻译来证明其改进。