基于树—串的汉文—新蒙文统计机器翻译系统的研究

来源 :内蒙古大学 | 被引量 : 1次 | 上传用户:luye063006300630
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着科技的日益进步,机器翻译这一利用高性能计算机来完成不同语言之间的翻译方法变得越来越重要。2003年以来,基于短语的模型成为了近十年的机器翻译的主流技术,然而短语间的重排序依然是基于短语的模型的一大缺陷。为解决这一缺陷,越来越多的研究者开始了基于句法的翻译模型的研究工作。然而相对于汉文,新蒙文的基础资源的建设就匮乏很多。汉文有了较成熟的词法和句法的分析模型,而新蒙文的词法分析刚刚开始发展,句法分析还是空白。利用源语言端句法分析作为指导的树-串翻译模型出现了,研究者们也证明了,该方法可以有效的解决基于短语的翻译模型中短语间重排序的缺陷。本文提出了运用基于树-串对齐模板(Tree-to-string Alignment Template,简称TAT)的翻译模型到系统中,它是一种在基于词的统计机器翻译的基础上引入句法树来指导翻译过程的翻译模型。针对目前蒙文机器翻译的基础信息建设不够完善的现状,无法获得大量的蒙文句法信息,在只对汉语的源语言端进行句法分析的情况下,树-串对齐模板的统计翻译模型无疑是非常适用的一种基于句法的统计机器翻译模型。最后,我们利用扩展后的双语词典对自动对齐结果进行了校正,编程实现了基于树-串的汉文-新蒙文统计机器翻译系统,并在此基础上加入了短语表优化了翻译结果。实验结果表明,词对齐的正确率高低直接影响最终译文的质量,并且证明了树-串对齐模板翻译模型对于汉文-新蒙文翻译的结果是有帮助的,翻译性能在加入短语表后也有了一定的提高。
其他文献
当前社会产生的大量数据需要更好的存储解决方案。近年来,基于网络技术的分布式存储,将数据存储在多个廉价设备上,已经得到了广泛的应用。但是考虑到系统的规模,系统中的构成节点
一个高质量的软件系统常常利用专家的设计经验,这个专家的设计经验称为设计模式。现在,设计模式被广泛地应用于各种软件系统设计中,但是这种架构的设计模式的相关信息在大量
鱼眼摄像机由于能一次性捕获视野达到180°甚至更大范围内的场景信息,在视频监控、机器人导航、目标跟踪及定位等领域有着广泛的应用,但是其存在的严重畸变又给鱼眼摄像机的应
工作流管理系统是实现企业信息化重要支撑系统之一,它通过协调多个人的活动、以协同完成某个共同的任务,从而有效的提高企业的经营效率。工作流引擎作为工作流管理系统的核心
随着云计算技术的发展,各种大小不一的数据中心纷纷出现,而这些数据中心往往存在各种虚拟机管理平台(如Eucalyptus, OpenNebula和OpenStack等),应用场景需求也完全不同,各种
无线通信技术随着科技的发展在不断的更新换代,基于无线信道的参数随机变化的特点,有关应对干扰所造成误码的讨论也在同步跟进。本系统采用新一代的混合自动重传(HARQ,HybridARQ)
随着网络资源的全球化,不同语言国家、民族的互联网用户飞速增长。伴随着不同语言使用者对网络需求的日益加剧并且由于语言的多样性使得跨语言信息检索成为信息检索领域的研
面向返回编程(Return Oriented Programming,ROP)是一种攻击技术,通过重用并链接内存中已存在的代码片段(gadget,以ret、jmp、call跳转指令结尾)组成攻击程序,能够实现任意的攻击行为
变分推理方法被广泛用于评估概率图模型的后验分布或分布对应的期望,其基本思想是通过变分转换将推理问题转化为一个变分优化问题,利用迭代方法以期望能够高效的获得一个近似解
设计模式是软件开发人员对经验的总结,描述了对一些可重复出现问题的有效解决方案。反模式是对模式概念的扩展,描述的是一个普遍采用的不良解决方案,该方案会给应用系统带来