【摘 要】
:
在蒙汉神经机器翻译任务中,由于语料稀少使得数据稀疏问题严重,极大影响了模型的翻译效果。该文对子字粒度切分技术在蒙汉神经机器翻译模型中的应用进行了研究。通过BPE算法
【基金项目】
:
内蒙古自然科学基金(2018MS06005);内蒙古蒙古语言文字信息化专项扶持项目(MW-2018-MGYWXXH-302);内蒙古自治区研究生科研创新项目(10000-16010109-18)
论文部分内容阅读
在蒙汉神经机器翻译任务中,由于语料稀少使得数据稀疏问题严重,极大影响了模型的翻译效果。该文对子字粒度切分技术在蒙汉神经机器翻译模型中的应用进行了研究。通过BPE算法将切分粒度控制在字符和词之间的子字粒度大小,将低频词切分成相对高频的子字片段,来缓解数据稀疏问题,从而在有限的数据和硬件资源条件下,更高效地提升模型的鲁棒性。实验表明,在两种网络模型中使用子字粒度切分技术,BLEU值分别提升了4.81和2.96,且随着语料的扩大,训练周期缩短效果也更加显著,说明子字粒度切分技术有助于提高蒙汉神经机器翻译效果。
其他文献
"节俭"作为中华民族的传统道德之一,是"厚德"的重要内容。因此,提倡"节俭",对宏扬"爱国、创新、包容、厚德"的北京精神具有重大意义。
针对内蒙古地区机器翻译力量薄弱、技术落后等现状,提出一种基于实例的翻译方法,使用不同粒度的对齐技术对蒙汉双语语料库进行处理,根据相似度算法进行匹配和重组并生成译文.
<正>一、发现问题我市推广实施分组教学已有几年时间,在学习元素化合物的分组讨论中,学生"说"得很"正确",但解题时很多学生却无从下手,尤其是遇到综合性问题时很难将多个知识
金融危机对我国劳动密集型企业、出口加工型企业影响较大,农民工受到的冲击影响最大。根据中央农村工作领导小组办公室主任陈锡文在国新办新闻发布会公布的数据,目前全国大约
<正> 在北朝史上,改革浪潮时起时伏,时断时续.其中尤以北魏改革为历代所注目.北魏改革很难明确详尽表述其起讫时间,但可以大致地认为,从拓跋珪称魏王后,北魏国内的各种矛盾就
《魏孝文帝传》《魏孝文帝传》,刘精诚著。天津人民出版社1993年12月第1版,248千字。北魏孝文帝拓跋宏是中国历史杰出的帝王之一,他所采取的均田制等改革措施,在当时产生了重大的影响。历史
<正>一、问题的提出团体心理活动是高中日常心理工作和对学生进行专题辅导的有效手段之一,在以往的开展过程中,我们往往以发现学生问题、解决学生问题为主,我们在团体活动中
结合自己的教学实践,从课的引入、成功体验、化学家故事、生产生活知识、化学实验、学习情境创设等方面阐述如何激发学困生学习兴趣,从而形成积极的学习态度。
<正> 在1992年11月2—5日召开的《天津经济发展国际研讨会》上,世界银行专家范·丹伯格作了关于鹿特丹港口货物集散地服务的报告。兹择要整理如下:鹿特丹保持它在欧洲的主要