
2022年7月,Meta(原Facebook)AI 发布了一个大规模机器翻译模型 NLLB-200 ,该模型在神经网络架构上混合了稠密和稀疏神经网络,参数规模达545亿,在覆盖202种语言、2440个语向的180亿平行句对上进行训练,训练后的单一模型可支持所有覆盖语言之间的的自动翻译(即202X201=40602个语向的互译)。 该模型的名字是英文No Language Left Behind的缩写,体现了机器翻译实现世界上所有语言互译的美好愿景。
1
历经70载,机器翻译进入
深度学习驱动时代 机器翻译诞生于二十世纪四五十年代,纵观机器翻译70多年的发展历程,从最初的朴素统计模式,发展到基于规则的机器翻译、统计机器翻译,再到目前的深度学习驱动的神经机器翻译,不同技术范式在不同历史时期各领风骚。
图源:https://acutrans.com/top-10-most-commonly-spoken-languages-in-the-world/ 目前机器翻译的主流技术范式——神经机器翻译——是一种基于神经网络的端到端机器翻译模式。区别于前代的统计机器翻译采用的多步骤级联方式,神经机器翻译只需要输入源语言句子,就能直接输出目标语言序列。 如下图所示,其基本思想是利用神经网络对源语言进行编码得到源语言的语义表示,然后根据该语义表示解码生成目标语言。这种端到端模式使模型可以一次性整体训练,既避免了传统级联方式的错误传递,也大大降低了模型训练和部署的烦琐程度。
来自书中图4.1:神经机器翻译结构示例
时至今日,神经机器翻译已成为在线机器翻译的主要引擎,每天以数千亿单词量的翻译规模服务全世界各地用户。
但即便如此,机器翻译仍然存在诸多挑战和难题。
一方面,
全世界在使用的语言有几千种,即使像NLLB这样的大规模模型,目前也只能覆盖200余种语言,占比不到已有语言的1/30,大量语言在机器翻译版图里仍然被“Left Behind”。
另一方面,
神经机器翻译虽然显著提升了译文质量,但仍然面临鲁棒性、可解释性、广域语境依赖性、多模态、资源稀缺等多种挑战和开放问题。
《神经机器翻译:基础、原理、实践与进
阶
》
正是在这样的背景中写就的。

2
“百科全书”式内容,
展现神经机器翻译全景视图 该书为实践者总结已有技术,为研究者梳理前沿进展,并站在机器翻译历史发展的角度,对比不同机器翻译范式,希望读者能从对比中窥见技术发展的内在原因和规律,以此吸引更多机器翻译爱好者为实现所有语言互译的美好愿景添砖加瓦。 全书分为基础篇、原理篇、实践篇和进阶篇, 覆盖神经机器翻译的基础知识、经典框架、原理技术、实践方法与技巧,以及无监督神经机器翻译、多语言神经机器翻译、语音与视觉多模态机器翻译等前沿研究方向。 全书理论与实践相结合,基础与前沿相交映。
3
技术与短评双主线叙事,
不止于技术 除此之外, 本书的一个特色是在每一章均附有一篇短评, 针对相应章节的主题,介绍和评论神经机器翻译技术背后的历史、故事、思想、哲学、争议和规范等。短评与全书内容相交错,使读者对神经机器翻译技术不仅知其然,而且知其所以然。
适读人群
本书适合高等院校计算机专业高年级本科生,以及人工智能、自然语言处理方向的研究生阅读,也可供机器翻译研究者、实践者、使用者,以及机器翻译行业的管理者、人工翻译研究人员等对机器翻译技术感兴趣的读者参考。
作者介绍
李良友
华为诺亚方舟实验室研究员、机器翻译团队负责人。在欧盟玛丽居里项目资助下,于2017年获得都柏林城市大学计算机博士学位。
主要研究方向为自然语言处理,特别专注于机器翻译相关技术领域的研发。在ACL、EMNLP等多个国际著名会议和期刊上发表论文10余篇,并担任ACL、EMNLP等国际会议领域主席和会议审稿人。
粉丝专享六折优惠
感兴趣的小伙伴可以扫码
留言赠书
AI科技评论本次联合【博文视点】为大家带来10本 《神经机器翻译:基础、原理、实践与进 阶 》 正版新书。 在本文(仅限AI科技评论微信公众号端)留言区留言,欢迎大家畅所欲言,谈谈你的机器翻译历程~在综合留言质量(留言是敷衍还是走心)和留言点赞(注:点赞最高的前10不意味着一定会中奖)的读者中选出10位读者获得赠书。获得赠书的读者请联系 AI 科技评论客服(aitechreview)。
- 留言内容会有筛选,例如"选我上去"、"这书写的很棒(仅仅几个字)"等内容将不会被筛选,亦不会中奖。
- 留言送书活动时间为2022年8月19日 - 2022年8月25日(23:00),活动推送时间内仅允许赠书福利中奖一次。
