研究院动态
上外语料库研究院邀请冯志伟教授做“机器翻译及其三种类型”讲座

    2020年5月11日下午,应上海外国语大学语料库研究院邀请,冯志伟教授做了题为“Machine Translation & Its Types: PBMT, SMT and NMT”的讲座,上外语料库研究院韩子满教授主持了讲座。

    冯志伟教授首先回顾了翻译产生的历史,并结合现今网络时代多元语言的特征,说明翻译技术是克服语言障碍的有力途径。冯志伟教授继续回溯了机器翻译的历史,介绍了Peter Troyanski的机器翻译思想,并用生动的图片展示了第一次机器翻译试验的状况,指出机器翻译是人工智能皇冠上的明珠。冯志伟教授以自己多年从事机器翻译研究的经验为基础,结合英、汉、日、德、俄等多种语言机器翻译案例,详细透彻地介绍了机器翻译三种类型PBMT (Phrase-Based Machine Translation)、SMT (Statistical Machine Translation)以及NMT (Neural Machine Translation)的原理。

    冯志伟教授结合Vauquois的三角模型,介绍了PBMT的两类机器翻译方法中间法和转换法,并指出这种基于规则的机器翻译要用到大规模双语词典和人工编写的语法规则、转换规则。而SMT则把翻译视为一个解码的过程,把机器翻译问题视为一个噪声信道问题,可以用信道模型来解码。这种基于统计的机器翻译需要大量单语语料建立语言模型,大量双语语料建立翻译模型。NMT是一种新兴的机器翻译方法,与SMT相比,这种基于神经网络的机器翻译虽然也需要双语语料库训练,但其所有的计算都是在无符号的真值上进行的,不需要短语表和规则表,且翻译性能更高。

    最后,冯志伟教授指出虽然机器翻译飞速发展,但仍存在一些问题,如:多义词和首字母缩略词翻译不准确、丢词漏词、小语种翻译正确率低、语料资源稀缺等。

    在提问环节,针对师生们提出的机器翻译与自然语言处理学习方法等问题,冯志伟教授耐心细致地进行解答。冯志伟教授的报告深入浅出、风趣幽默,吸引了500多名师生观看,大家纷纷表示受益匪浅。


撰稿:闫潼