翻译要失业?微软中英翻译机器人通过测试,可媲美人类将商用

文/严冬雪

编/赵艳秋

3月14日,微软宣布,其研发的机器翻译系统,在通用新闻报道测试集newstest2017的中英测试集上,达到了可与人工翻译媲美的水平。这是首个在新闻报道的翻译质量和准确率上可比肩人工翻译的翻译系统。

为了确保翻译结果准确且达到人类的翻译水平,微软研究团队邀请了双语语言顾问,将微软机翻结果与两个不同的人工翻译结果进行比较。

微软技术院士,负责微软语音、自然语言和机器翻译工作的黄学东称,这是对自然语言处理领域最具挑战性任务的一项重大突破。“在机器翻译方面达到与人类相同的水平是所有人的梦想,我们没有想到这么快就能实现。”他表示,“消除语言障碍,帮助人们更好地沟通,这非常有意义,值得我们多年来为此付出的努力。”

微软技术院士黄学东

机器翻译是科研人员攻坚了数十年的研究领域,曾经很多人都认为机器翻译根本不可能达到人类翻译的水平。尽管此次突破意义非凡,但这仍不代表人类已经完全解决了机器翻译的问题,只能说离终极目标又近了一步。

微软机器翻译团队研究经理Arul Menezes解释:当一种语言(比如中-英)拥有较多的训练数据,且翻译的是常见的大众类新闻词汇时,人工智能加持下的机器翻译表现可以与人类媲美。

近两年来,深度神经网络的使用让机器翻译的表现取得了实质性突破。相较于以往,机器翻译结果变得更加自然流畅。

微软将他们的最新研究成果——对偶学习(Dual Learning)和推敲网络(Deliberation Networks)应用在了此次取得突破的机器翻译系统中。微软亚洲研究院副院长、机器学习组负责人刘铁岩介绍道,“这两个技术的研究灵感其实都来自于我们人类的做事方式。”

其中,对偶学习使得中文句子翻译成英文之后,系统会将相应的英文结果再翻译回中文,并与原始的中文句子进行比对。从这个比对中,机器会学习有用的反馈信息,对翻译模型进行修正。

推敲网络则类似于人们写文章时不断推敲、修改的过程。通过多轮翻译,不断地检查、完善翻译的结果,从而使翻译质量得到大幅提升。

微软亚洲研究院副院长、机器学习组负责人刘铁岩

周明带领的自然语言计算组,多年来一直致力于攻克机器翻译——这一自然语言处理领域最具挑战性的研究任务。“翻译没有唯一的标准答案,它更像是一种艺术,因此需要更加复杂的算法和系统去应对。”周明表示。

微软亚洲研究院副院长、自然语言计算组负责人周明

此次newstest2017新闻报道测试集,包括约2000个句子,由专业人员从报纸样本翻译而来。微软团队每次会随机挑选数百个句子翻译。

为了验证机器翻译是否可以媲美人类翻译,测试经历了极为复杂的验证过程。这是因为,没有所谓“正确的”翻译结果,即使是两位专业的翻译人员,对同一个句子也会有略微不同的翻译,而且两个人的翻译都不是错的。表达同一个句子的“正确的”方法不止一种。

周明解释:“这也是为什么机器翻译比单纯的语音识别复杂得多,人们可能用不同的词语来表达完全相同的意思,但未必能准确判断哪一个更好。”

相比之下,判断语音识别能否媲美人类则相当简单:标准答案是唯一的。

这种没有标准答案的任务,使得机器翻译成为一个极有挑战、同时极富意义的问题。刘铁岩表示,我们不知道哪一天,机器翻译才能在面临任何语种、任何类型的文本时,都能在“信、达、雅”上媲美专业翻译人员的水准。但总体而言,他对技术的进展表示乐观,因为整个学术界在持续发明大量的新技术、新模型和新算法,

“我们可以预测的是,新技术的应用一定会让机器翻译的结果日臻完善。”微软团队还表示,此次技术突破将被应用到微软的商用多语言翻译系统产品中。