多粒度蒙古文汉文神经网络机器翻译研究

来源 :内蒙古大学 | 被引量 : 8次 | 上传用户:hntkpop
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习技术的发展,神经机器翻译已经取得超过其它翻译技术的效果,但仍存在很多问题。在神经机器翻译中训练语料有限,不可避免会产生数据稀疏问题。蒙汉平行语料贫乏,因此蒙汉机器翻译数据稀疏问题会更严重。在神经机器翻译模型中,词切分技术已经在西方语言神经机器翻译中得到广泛应用,并取得很好的效果。在本文中研究多种蒙古文切分粒度下神经机器翻译模型的翻译效果。本文对比了蒙古文词、蒙古文子词和蒙古文字符在循环神经机器翻译、卷积神经机器翻译和Transformer翻译模型中的翻译表现。实验结果表明在三种机器翻译模型中,蒙古文子词表现最好,蒙古文词次之,蒙古文字符表现最差。可以说明一定程度的切分可以提高机器翻译效果。本文分析了蒙古文字符翻译的特点,并根据特点改进字符级翻译模型。第一个特点,蒙古文词切分为字符后词与词之间的边界消失,需要使模型优先学习同一词切分出的字符序列。第二个特点,本文在研究中发现,字符级翻译模型的编码器的输出中,有很多输出对解码器影响很小,因此考虑需要对编码器输出进行过滤。本文针对以上特点,提出两种改进方法。第一种,增加卷积层,这样可以优先学习字符序列局部信息。第二种,增加线性门控单元,可以用来过滤卷积层的输出。经过改进后的Transformer字符级翻译模型实验结果取得41.07 BLEU,比改进前字符级翻译模型提高6.64 BLEU,比子词级翻译模型提高3.84 BLEU,比词级翻译模型提高5.21 BLEU。改进后的字符级循环神经机器翻译模型翻译效果提高3.54 BLEU。
其他文献
目的探讨在腰椎间盘突出症患者治疗中采取经皮椎间孔镜腰椎间盘摘除术的临床效果。方法观察组患者均采取经皮椎间孔镜下的髓核摘除手术治疗,对照组患者行小切口下椎板开窗髓
在我国蔗糖业遭遇前所未有的低谷之际 ,江门甘蔗化工厂(集团)股份有限公司却以其骄人的业绩 ,最近荣获中国食品工业协会颁予的“中国食品工业优秀企业”的称号 ,该公司董事局主
期刊
目的 分析中药足浴配合中医内科护理在老年失眠症中的应用效果.方法 本研究将2016年1月-2017年6月120例老年失眠症患者作为研究对象,随机分为观察组(60例)和对照组(60例);对照组
以贵州省临泉镇海子村为例,对村庄规划的编制方法和编制重点进行研究。认为村庄规划需要进行合理的村庄布局,制定产业发展策略,完善公共设施配置,通过制定实施计划和项目库建
随着市场营销观念的深入,故事营销得到越来越多的关注。由于中医药企业的独特文化特色,故事营销这种策略日益受到青睐。本文从故事营销与中医药企业品牌的契合性、中医药企业
在城市化的深入推进与发展下,我国城市人口的数量不断增多,各种生活与工作方面的需求,使得城市给排水管道建设的需求量相应增加。而市政给排水管道作为一项涉及范围广、技术
叙述了人畜共患病的种类,人畜间的传播方式,对人畜的危害及其防制措施。简要的介绍了部分国家的兽医公共卫生事业的概况和我国人畜共患病的防制情况,分析了我国人畜共患病的防制
在高职院校中,顶岗实习已经被普遍纳入到学校教学计划,在高技能专门人才的培养中起到了极其重要的作用。本文从对学生顸岗实习过程中出现的问题入手,对问题产生的原因进行了简单
<正>丝绸之路,是古代东西方文明的融合、交流和对话之路,是人类历史上规模最大的文化线路。6月22日,在第38届世界遗产大会上,中国与吉尔吉斯斯坦、哈萨克斯坦联合提交的"丝绸
吴茱萸为芸香科植物吴茱萸Evodia rutaecarpa(Juss)Benth、石虎Evodia rutaecarpa( Juss.)var.Benth.officinalis(Dode)Huang或疏毛吴茱萸Evodia rutaeca-rp(J uss) Benth .var.bodin