带标记音节的双向维汉神经机器翻译方法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户：chunxianniunai

【摘要】

：

近年来,基于神经网络的机器翻译成为机器翻译领域的主流方法,但是在低资源翻译领域中仍存在平行语料不足和数据稀疏的挑战.针对维-汉平行语料不足和维吾尔语形态复杂所导致的

【作者】

：

艾山·吾买尔斯拉吉艾合麦提·如则麦麦提西热艾力·海热拉刘文其吐尔根·依布拉音汪烈军瓦依提·阿不力孜

【机构】

：

新疆大学信息科学与工程学院,乌鲁木齐 830046;新疆大学新疆多语种信息技术实验室,乌鲁木齐 830046;新疆大学软件学院,乌鲁木齐 830091

【出处】

：

计算机工程与应用

【发表日期】

：

2021年4期

【关键词】

：

神经机器翻译数据稀疏音节粒度维汉神经机器翻译

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来,基于神经网络的机器翻译成为机器翻译领域的主流方法,但是在低资源翻译领域中仍存在平行语料不足和数据稀疏的挑战.针对维-汉平行语料不足和维吾尔语形态复杂所导致的数据稀疏问题,从维吾尔语的音节特点出发,将单词切分成音节,同时融入BME(Begin,Middle,End)标记思想,提出一种基于带标记音节的神经网络机器翻译方法.与使用单词粒度和BPE粒度的两类神经网络机器翻译方法对比,该方法在维-汉机器翻译任务中分别提升7.39与3.04个BLEU值,在汉-维机器翻译任务中分别提升5.82与3.09个BLEU值,可见在平行语料不足的条件下,该方法有效地提升了维-汉机器翻译的质量.

其他文献

依达拉奉及异丙酚联合预处理、后处理对乳鼠离体脑皮质细胞缺血再灌注损伤保护作用的研究

会议

依达拉奉异丙酚联合预处理后处理乳鼠离体脑皮质细胞缺血再灌注损伤

不同剂量左旋甲状腺素钠预先给药对幼龄大鼠离体心脏缺血再灌注损伤的影响

会议

不同剂量左旋甲状腺素钠预先给药幼龄大鼠离体心脏缺血再灌注损伤

瑞芬太尼复合静脉麻醉在脑内动脉瘤介入栓塞术中的应用

会议

瑞芬太尼复合静脉麻醉内动脉瘤介入栓塞术

肺肿瘤经皮射频和微波消融治疗后肋骨骨折:发生率及相关性

目的回顾性地确认肺肿瘤病人经皮射频消融(RFA)和微波消融(MWA)后肋骨骨折的发生率及可能的危险因素,并确认与肋骨骨折有关的并发症。材料与方法机构审查委员会批准获得了HIP

期刊

肺肿瘤微波消融肋骨骨折经皮射频消融临床参数男性病人女性病人放射医师脏器损害依从性

Efficient Preparation of Nanoparticle-Reinforced Nickel-based Composite Coating with Highly Preferre

Nanoparticle-reinforced metal matrix composite coatings have significant potential in mechanical part surface strengthening owing their excellent mechanical pro

期刊

Jet electrodepositionComposite coatingPreferred orientationAdhesion forceCor

全膝关节置换术后康复训练中连续股神经阻滞镇痛的影响

会议

全膝关节置换术后康复训练股神经阻滞镇痛

急性颅脑创伤手术患者的麻醉

会议

颅脑创伤手术患者

创伤性急性肺损伤时钙离子介导的缝隙连接通道调节肺血管通透性的实验研究

会议

创伤性急性肺损伤钙离子介导缝隙连接通道调节肺血管通透性

高寒环境犬肢体爆炸伤后早期救治时间窗的实验研究