论文部分内容阅读
摘 要:民机行业发展迅猛,面对日益增加的手册翻译量,以及编制与翻译人员匹配不平衡的局面,民机出版物应当与时俱进,引入人工智能技术,让机器取代重复性劳动;减轻译员在低技术含量工作中的负担,将人力资源得到最合理,最有效的利用;让人工智能协助人的工作,提高翻译效率和翻译质量,保证及时交付高质量的手册。
关键词:人工智能;机器翻译;民机出版物
一、引言
人工智能(Artificial Intelligence,AI)是计算机科学技术的一个前沿分支,通过有限样本,以及特定算法不断训练,使机器在某些领域具备像人脑一样的水平并利用计算机模拟人类智力活动。
如今人工智能已经从实验室迈向商业市场,进入日常生活的方方面面,如小米小爱聊天机器人,讯飞语音识别翻译,自动驾驶,面部识别等技术,人们也接受并开始享受人工智能带来便捷的生活方式,我们的生活已与人工智能息息相关,密不可分。
二、机器翻译
机器翻译(Machine Translation, MT)是人工智能中应用较为广泛的一种技术,它基于神经网络的算法并对大量语料以及词汇进行拆分;通过特定的语法结构对语言进行重组,自主形成译文;机器翻译可以快速地给出可读性颇高的译文,再由译员进行译后编辑审校,在短时间内交付出高质高效的译文。
三、民机出版物翻译现状及问题
1.出版物手册的现状
●以某国内航空器手册部门为例,由于机型更新换代以及多型号改装时刻在进行,飞机手册也随之不断迭代改版;且由于技术出版物手册翻译处于整个手册换版周期的末端,经过前期手册编审、发布、定稿,留给手册翻译的时间较少,译员需在极短时间完成大量手册的译校工作;同时保证译文与原文一致性及术语一致性;既保证速度又保证质量,承受着巨大心理和工作负担。
●航空器手册类文件字数动辄上百万,换版次数频繁且人员分布不平衡,致使翻译版本滞后。如某国产机型交付客户手册多达40余本,字数多达数十万A4页;手册内容涉及飞机设计、生产和制造的方方面面,保证对所翻译的内容都完全理解并给出地道的译文,对于译员来说也是十分有挑战的。
●在技术出版物手册编制过程中,常使用结构化的编写方式,其中包含手册正文和具有特定含义的标签,这些标签为内嵌标签并代表了特定的意义,是正文的一部分,因此无法简单的隐藏处理。大量内部参引标签常导致断句问题或者句子增加多处标签形成超长句,对理解造成困扰;翻译时必须同时处理这些标签,给翻译和审校工作带来不小的困难。
2.非智能翻译系统面临的问题
●不支持机器翻译,插图翻译、无法样式化预览,导致图文翻译不同步、术语不一致;缺乏智能纠错功能,手册翻译量大时易出错,尤其是漏译、不一致等低级错误,以及数据、关键词的误译等。译文审校驳回率居高不下,影响译文提交时效性。
●流程设置没有AI智能定制,预翻译及解析文件耗时长,影响进度;重复性工作多,分配任务需逐个文件点击配置,无法批量处理。
●无法将术语及时更新到库中,导致一个术语产生多种译法;应用AI技术,实时更新同步术语,保证术语和句式的统一,减少译员工作量,提高翻译速度,确保手册不同语言版本能同步交付。
四、机器翻译的功能
●机器翻译引擎首先会对大量相关语料进行多轮深度学习,并模拟语料模型中的翻译风格对新增的翻译内容进行翻译,因而用来进行机器训练的语料质量直接影响机器翻译的质量。
●可以批量预处理,包括批量预翻译以及批量解析文件;可由项目经理在创建项目的同时一键完成所有项目的预处理;译员接收到文件可直接开始翻译,无需其他冗余操作,节约时间成本。
●项目经理可全程追踪所有分配文件的进度,随时调整人员分工,快速生成译员翻译量统计报告。每人每日每月翻译量都可清晰明确的展现出来。
●语料库进行预翻译后,启动机翻从而自动形成有百分之七十以上可读性的译文;译员只需在此基础上进行译后编辑,省时高效。
●建立自己独有的语料及术语库,随着翻译量不断增加,经过一字一句的磨练、积累,不断的扩充语料库,积累越来越多的宝贵资源。译员在翻譯时使用共享服务器的语料库,实时查看其它译员对于同一句话的理解和译法,互通有无,也省去了重复查找术语的过程,事半功倍。
●引进机器翻译的初期,由于机器翻译整体质量较人工翻译低,翻译工作量虽大幅减少,但校对工作量会有一定程度增长;随着机器翻译对人工译文持续开展深度学习,且翻译模型不断进行优化,机器翻译质量将逐步提升,人工校审工作量将逐步下降,整体翻译效率逐步提升。
五、机器翻译在出版物翻译中的应用
机器翻译软件将用于国内航空制造商技术出版物的中英互译,将与当前计算机辅助翻译系统及出版物编制系统集成,翻译人员可通过CAT调用MT功能,编写人员也可以通过编制系统调用MT功能,实现自动翻译,协助翻译人员提供准确及时的翻译服务。
在现有人力配置不变的前提下,为保证翻译的时效性,必须依靠智能化的途径,机器翻译便是最佳选择。经预估,高质量的机器翻译可压缩翻译环节工时达80%以上,大幅节约人力资源经费。
1.通过编制系统进行翻译的模式
在编写软件中调用机器翻译插件,当完成一个模块的编写后,调用机器翻译完成模块的翻译工作,中文数据模块和英文数据模块在检入系统后走各自的校审流程。
2.通过CAT调用机器翻译的模式
在CAT中建立翻译项目,通过CAT管理翻译任务和翻译知识库;翻译人员利用语料库进行预翻译后,调用机器翻译插件,进行自动翻译,完成后翻译人员只需对翻译结果进行逐一检查、修订即可;经过校审的中英文句对进入翻译知识库,供下一次翻译使用;
未来可以基于智能翻译引擎,进行私有化部署,并基于基础神经网络模型定制开发语音识别翻译自学习训练模型、图像翻译自学习训练模型等算法库、拓展开发用于其它应用场景的语料库和术语库、语音库和图像库等数据资产库。
六、结语
目前来说,机器翻译已发展到较高的水平阶段,输出的译文可用性较高,然而翻译是通过对原文的理解进行的再创作,机器是否能完全代替人脑进行智能化翻译,仍有待考察;而译员也应顺应时代科技的发展,在提高自身语言能力的同时,也能不断学习新的科技,让机器服务于人而不是取代人,使人工智能能够在翻译领域有更长远的发展,让人与机可以和谐发展,完美融合。
作者简介:
袁睿,香港大学硕士研究生,工程师,从事民用飞机技术出版物翻译工作七年。
关键词:人工智能;机器翻译;民机出版物
一、引言
人工智能(Artificial Intelligence,AI)是计算机科学技术的一个前沿分支,通过有限样本,以及特定算法不断训练,使机器在某些领域具备像人脑一样的水平并利用计算机模拟人类智力活动。
如今人工智能已经从实验室迈向商业市场,进入日常生活的方方面面,如小米小爱聊天机器人,讯飞语音识别翻译,自动驾驶,面部识别等技术,人们也接受并开始享受人工智能带来便捷的生活方式,我们的生活已与人工智能息息相关,密不可分。
二、机器翻译
机器翻译(Machine Translation, MT)是人工智能中应用较为广泛的一种技术,它基于神经网络的算法并对大量语料以及词汇进行拆分;通过特定的语法结构对语言进行重组,自主形成译文;机器翻译可以快速地给出可读性颇高的译文,再由译员进行译后编辑审校,在短时间内交付出高质高效的译文。
三、民机出版物翻译现状及问题
1.出版物手册的现状
●以某国内航空器手册部门为例,由于机型更新换代以及多型号改装时刻在进行,飞机手册也随之不断迭代改版;且由于技术出版物手册翻译处于整个手册换版周期的末端,经过前期手册编审、发布、定稿,留给手册翻译的时间较少,译员需在极短时间完成大量手册的译校工作;同时保证译文与原文一致性及术语一致性;既保证速度又保证质量,承受着巨大心理和工作负担。
●航空器手册类文件字数动辄上百万,换版次数频繁且人员分布不平衡,致使翻译版本滞后。如某国产机型交付客户手册多达40余本,字数多达数十万A4页;手册内容涉及飞机设计、生产和制造的方方面面,保证对所翻译的内容都完全理解并给出地道的译文,对于译员来说也是十分有挑战的。
●在技术出版物手册编制过程中,常使用结构化的编写方式,其中包含手册正文和具有特定含义的标签,这些标签为内嵌标签并代表了特定的意义,是正文的一部分,因此无法简单的隐藏处理。大量内部参引标签常导致断句问题或者句子增加多处标签形成超长句,对理解造成困扰;翻译时必须同时处理这些标签,给翻译和审校工作带来不小的困难。
2.非智能翻译系统面临的问题
●不支持机器翻译,插图翻译、无法样式化预览,导致图文翻译不同步、术语不一致;缺乏智能纠错功能,手册翻译量大时易出错,尤其是漏译、不一致等低级错误,以及数据、关键词的误译等。译文审校驳回率居高不下,影响译文提交时效性。
●流程设置没有AI智能定制,预翻译及解析文件耗时长,影响进度;重复性工作多,分配任务需逐个文件点击配置,无法批量处理。
●无法将术语及时更新到库中,导致一个术语产生多种译法;应用AI技术,实时更新同步术语,保证术语和句式的统一,减少译员工作量,提高翻译速度,确保手册不同语言版本能同步交付。
四、机器翻译的功能
●机器翻译引擎首先会对大量相关语料进行多轮深度学习,并模拟语料模型中的翻译风格对新增的翻译内容进行翻译,因而用来进行机器训练的语料质量直接影响机器翻译的质量。
●可以批量预处理,包括批量预翻译以及批量解析文件;可由项目经理在创建项目的同时一键完成所有项目的预处理;译员接收到文件可直接开始翻译,无需其他冗余操作,节约时间成本。
●项目经理可全程追踪所有分配文件的进度,随时调整人员分工,快速生成译员翻译量统计报告。每人每日每月翻译量都可清晰明确的展现出来。
●语料库进行预翻译后,启动机翻从而自动形成有百分之七十以上可读性的译文;译员只需在此基础上进行译后编辑,省时高效。
●建立自己独有的语料及术语库,随着翻译量不断增加,经过一字一句的磨练、积累,不断的扩充语料库,积累越来越多的宝贵资源。译员在翻譯时使用共享服务器的语料库,实时查看其它译员对于同一句话的理解和译法,互通有无,也省去了重复查找术语的过程,事半功倍。
●引进机器翻译的初期,由于机器翻译整体质量较人工翻译低,翻译工作量虽大幅减少,但校对工作量会有一定程度增长;随着机器翻译对人工译文持续开展深度学习,且翻译模型不断进行优化,机器翻译质量将逐步提升,人工校审工作量将逐步下降,整体翻译效率逐步提升。
五、机器翻译在出版物翻译中的应用
机器翻译软件将用于国内航空制造商技术出版物的中英互译,将与当前计算机辅助翻译系统及出版物编制系统集成,翻译人员可通过CAT调用MT功能,编写人员也可以通过编制系统调用MT功能,实现自动翻译,协助翻译人员提供准确及时的翻译服务。
在现有人力配置不变的前提下,为保证翻译的时效性,必须依靠智能化的途径,机器翻译便是最佳选择。经预估,高质量的机器翻译可压缩翻译环节工时达80%以上,大幅节约人力资源经费。
1.通过编制系统进行翻译的模式
在编写软件中调用机器翻译插件,当完成一个模块的编写后,调用机器翻译完成模块的翻译工作,中文数据模块和英文数据模块在检入系统后走各自的校审流程。
2.通过CAT调用机器翻译的模式
在CAT中建立翻译项目,通过CAT管理翻译任务和翻译知识库;翻译人员利用语料库进行预翻译后,调用机器翻译插件,进行自动翻译,完成后翻译人员只需对翻译结果进行逐一检查、修订即可;经过校审的中英文句对进入翻译知识库,供下一次翻译使用;
未来可以基于智能翻译引擎,进行私有化部署,并基于基础神经网络模型定制开发语音识别翻译自学习训练模型、图像翻译自学习训练模型等算法库、拓展开发用于其它应用场景的语料库和术语库、语音库和图像库等数据资产库。
六、结语
目前来说,机器翻译已发展到较高的水平阶段,输出的译文可用性较高,然而翻译是通过对原文的理解进行的再创作,机器是否能完全代替人脑进行智能化翻译,仍有待考察;而译员也应顺应时代科技的发展,在提高自身语言能力的同时,也能不断学习新的科技,让机器服务于人而不是取代人,使人工智能能够在翻译领域有更长远的发展,让人与机可以和谐发展,完美融合。
作者简介:
袁睿,香港大学硕士研究生,工程师,从事民用飞机技术出版物翻译工作七年。