基于注意力神经网络的蒙汉机器翻译系统的研究

来源 :内蒙古大学 | 被引量 : 12次 | 上传用户:guider_zq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,深度学习成为众多领域研究的热点。对于自然语言处理领域中的机器翻译任务,序列到序列的神经网络翻译系统的出现打破了传统机器翻译多模块协调组合的局面,一体化的结构,令人满意的翻译结果使其一开始就备受学者瞩目。后来基于注意力(Attention-based)的神经网络进一步改进了模型,使得翻译效果一定程度上超过了传统的统计机器翻译系统,成为主流的翻译系统之一。本文以注意力神经网络为研究背景,结合最近的相关科研成果,从以下三方面展开了对基于注意力神经网络的蒙汉机器翻译系统的研究:(1)蒙古文词向量的预训练:词向量是直接参与模型训练的词语的表示形式,其训练的质量直接关系到最后训练的翻译模型的质量,因此我们探索了三种蒙古文词向量的预训练方法来提升翻译的质量;(2)基于字典的蒙古文词切分:蒙古文的构词特点会造成训练语料出现严重的数据稀疏问题,我们基于字典,对蒙古文单词进行了词缀、词干及格的附加成分等不同粒度的词切分,以此来缓解数据稀疏问题;(3)蒙古文特征提取:对于蒙古文来说,词干、词缀和格的附加成分是其构词的语言特色,我们同样基于字典将这些语言特色作为特征提取出来参与到系统的训练中,以此来提高神经网络翻译系统的翻译效果。最后,我们构建并改进了一个完整的基于注意力神经网络的蒙汉翻译系统。实验表明,基于我们的方法,该系统能比基线系统BLEU得分最多提高了 2.47个百分点,最优的模型BLEU值达到了 30.19。
其他文献
现有人力资源管理教学平台偏重理论教学,缺少实践教学,故提出基于“互联网+”的人力资源管理教学平台设计与实现研究。设计平台包含3个模块:ERP沙盘模拟实践教学模块设置ERP
目的探讨氨甲环酸(TXA)在初次全髋关节置换术中的应用剂量、效果及并发症发生情况。方法将常州市中医院2016年2月至2017年1月需行单侧初次全髋关节置换术的65例患者随机分为对
电力企业以其为经济发展提供动力支持的方式,在经济快速发展的浪潮中得以飞速的进步。电力企业的发展需要其提供稳定电力供应为前提,而输电线路作为电网运行的重要环节,其一旦发
目的研究孔隙率对β-磷酸三钙(β-TCP)陶瓷结构和释药速率的影响.方法在β-TCP 粉末浆液中加入不同重量比的造孔剂聚甲基丙烯酸甲酯(PMMA)烧制圆片状致密β-TCP 陶瓷,分别测定其
11月30日,潍坊·优然牧业(滨海)万头高产奶牛示范项目开工仪式在滨海区央子街道走马岭村举行。优然牧业副总经理许燕飞,副市长马清民,区领导李树森、李铁柱及央子街道机
进入21世纪以来,各行各业的产品质量都有了很大幅度地提高。建筑作为人们的生活必需品,其质量的好坏直接影响着人们生活的舒适与人身安全,因此更要严格地把控其质量水平。电
深圳职业技术学院计算机应用工程系对原微型计算机原理课程进行改革,经过对三届学生的教学实践,将《IA-32计算机技术》课程的教学方法归纳为“一个平衡点、一条主线、四个支撑
云南汤丹铜矿含铜品位低(平均含Cu0 64%)、氧化率高(>70%)、碱性脉石含量高(CaO+MgO>40%),而且嵌布粒度很细,给矿石加工处理带来很大困难。通过"九五"科技攻关,在试验研究的
以澳门南湾湖为例,对一个小型湖泊水质模拟模型的基本结构功能进行了描述.并且在进行水质模拟过程中,比较了两种用于参数率定的不确定性分析算法,讨论了参数不确定性,以及传