Character-Aware Low-Resource Neural Machine Translation with Weight Sharing and Pre-Training

来源 :第十八届中国计算语言学大会暨中国中文信息学会2019学术年会 | 被引量 : 0次 | 上传用户:wcd_wang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  Neural Machine Translation(NMT)has recently achieved the state-of-the-art in many machine translation tasks,but one of the challenges that NMT faces is the lack of parallel corpora,especially for low-resource language pairs.And the result is that the performance of NMT is much less effective for low-resource languages.To address this specific problem,in this paper,we describe a novel NMT model that is based on encoder-decoder architecture and relies on character-level inputs.Our proposed model employs Convolutional Neural Networks(CNN)and highway networks over character inputs,whose outputs are given to an encoder-decoder neural machine translation network.Besides,we also present two other approaches to improve the performance of the low-resource NMT system much further.First,we use language modeling implemented by denoising autoencoding to pre-train and initialize the full model.Second,we share the weights of the front few layers of two encoders between two languages to strengthen the encoding ability of the model.We demonstrate our model on two low-resource language pairs.On the IWSLT2015 English-Vietnamese translation task,our proposed model obtains improvements up to 2.5 BLEU points compared to the baseline.We also outperform the baseline approach more than 3 BLEU points on the CWMT2018 Chinese-Mongolian translation task.
其他文献
随着经济社会发展,人们对黄河水资源的需求日益增多,黄河水资源供需矛盾问题也越来越突出.本文在总结当前黄河水资源利用形势的基础上,以惠民黄河水资源利用现状为切入点,分析现阶段黄河水资源节约集约利用中存在的问题,并提出了解决问题的建议.
为积极响应黄河流域生态保护和高质量发展重大国家战略,抓好智慧水利顶层设计,以水利信息化驱动水利现代化,我局组织编制了信息化“十四五”规划,本文从五个部分阐述了该规划的思路及特点.分别是:山东黄河及信息化基本情况及存在的问题;总体框架的层次划分;沿河光纤骨干网以及政务外网、工控网划分思路及方案;局域网划分为不同区域,提升监管和安全;业务应用体系规划了水灾害防治、水资源管理、水环境水生态管理、工程管理
学位
学位
运用降水与径流双累积曲线法、Mann-Kendall法,变差系数Cv等指标对东里店水文站1956~2016年系列径流资料进行分析,以判断水库建设、小流域治理、沂源县城区面积扩大、农业种植结构改变等下垫面变化对沂河上游流域天然径流的影响及其程度.经分析可见,沂河上游流域天然径流量有减少趋势但不明显,年际间的变化趋于平缓;水利工程尤其水库调蓄仍是主要影响因素,小流域治理导致降水截留、蓄渗增加亦影响了天
地下水监测研究工作是国民经济建设的一项基础工作,是水利、水文事业的重要组成部分.根据《国家地下水监测工程(水利部分)山东省监测井建设工程第10标段合同》要求,2017年7月31日泰安市完成49眼自动监测井的土建工作,安装自动监测仪器后,2018年正式投入运行,国家地下水监测站建设完成后,如何更好的做好运行维护与管理工作已成为地下水管理工作中的重中之重.本文结合泰安市国家地下水监测工程运维与管理中存
学位
学位
基于黄河宁夏、内蒙古河段实地查勘和实测资料进行了分析.研究总结了宁蒙河段2020~2021年度凌情特点.黄河宁蒙河段2020~2021年度凌情具有流凌封冻前气温高,流量大,河段流凌、封冻时间接近常年;封河流量大,首封河段出现几封几开现象;盖面冰层厚;槽蓄量增量小,开河过程释放完全;个别断面封河水位高;开河时间早、速度快、开河过程未出现大的凌峰流量;全线开通日期为有资料以来最早等特点.形成本年度凌情
为解决城市洪涝监测预警预报与应急响应中城市地下管网水位精准监测的难题,在调研分析城市地下管网水位监测的现状的基础上,研究基于120GHz调频连续波的一体化雷达水位计的技术路线,为城市地下管网水位精准监测提供一种性价比高的解决方案.