基于多语种平行语料库的机器辅助翻译系统

来源 :中国航天第二研究院 航天科工集团第二研究院 | 被引量 : 0次 | 上传用户:xzhtqx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着国际交流的日益频繁,翻译行业蓬勃发展,在翻译行业中进行了越来越多的信息化建设,其中最为突出的是引入了机器翻译和机器辅助翻译产品,以及将翻译流程管理信息化,用于替代或者辅助人的活动,这些工作已经可以在一定程度上提高翻译行业的效率。同时在国内有许多的大学、研究机构从事机器翻译或者机器辅助翻译的研究,取得了丰硕的研究成果,但是成果产品化不够,特别是辅助翻译产品,由于需要大量的语料资源,其软件不能在大规模真实语料下进行测试,因而限制了整个软件的质量。 通过与中国对外翻译出版公司合作,在其30多年来不断积累的文献的基础上,该文构建出了一个大型的多语种平行语料库,通过规范构建过程以及操作过程,既保证了语料库的规模,也确保了语料的质量。在已有资源的基础之上,将开发一个机器辅助翻译软件,用来提高翻译人员的工作效率。 本文阐述了构建一个语料库的流程和用到的关键算法,设计了一个辅助翻译软件,实现了关键的算法。其中关于中文文本查重的算法综合了汉语语言学的研究成果,提出了一种提取中文文本特征串的方法。在辅助翻译软件的设计过程中,将基于翻译记忆库技术的辅助翻译引擎看成一个基于全文索引的搜索引擎,以便提供相同或者相似的句子的译文给译员参考,通过对中文句子进行“分字”的方法,扩展了关于中文处理中“分词”的概念,从而可以按照统一的方式处理中文和其它字符体系语种的索引问题,保证了辅助翻译软件对于语种的可扩充性。
其他文献
随着社会的进步和发展,人们不断涉及和需要解决很多复杂的实际应用问题,图像匹配问题是数字图像处理的一个重要的领域,它广泛应用在卫星与导弹的制导与导航和机器识别等诸多领域
高等级安全操作系统的完整性保护比机密性保护要复杂得多,对它的研究工作远没有机密性保护进展得顺利。本文基于TESEC等国内外计算机信息系统评估标准的要求,从理论和实践两个
学位
一颗子弹飞向正在举行国宴的人民大会堂,专家最初意见让刑警们排查了所有通过长安街的车辆;两个外国儿童死在了歹徒枪口下,却让抓捕歹徒的民警险些蒙受不白之冤。而当年这两
在20世纪90年代,供应链管理已经成为管理者口中必备的词汇,企业已经认识到供应链管理SCM(Supply Chain Management)在降低成本,提高客户服务水平,加强企业竞争力过程中所引起的重
随着计算机软硬件技术和管理科学的飞速发展,实施项目管理已经离不开计算机应用,国内外对项目管理软件的开发和应用也有了飞跃的发展。这些项目管理软件把人们从繁杂的任务追踪
In this paper, we demonstrate the acetylehe (C2H2) sensor with high sensitivity using a hollow-core photonic bandgap fiber (HC-PCF). Experiments for measuring C
赴法勤工俭学,与许多共产党人相识相知;参加国民党“一大”,成为国民党第二、三、四届中央委员;40年代发起组织“小民革”“、民联”“、民革”,加入知名民主人士的行列;解放
1982年10月,原西安公路交通大学劳动服务公司办公室副主任田芃同志光荣离休,本应是该颐养天年了,可当他了解到自己的故乡合阳县黑池镇峪北村依旧贫穷,乡亲们仍然匍匐在温饱
可视语音合成技术,旨在为输入语音生成同步的唇形动画和表情动画,从而使应用具有更友好的交互体验,具有重要的应用前景和应用价值。互联网尤其是移动互联网的发展和普及,为可视语
本文对配电网中无功补偿并联电容器组投切时间进行理论分析,在理论分析的基础上,采用后台计算机的监控系统中实现的电压无功综合控制方法,分析了无功控制(VQC)原理,给出了相