基于依存图网络的汉越神经机器翻译方法

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:lw_hualei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉越神经机器翻译是典型的低资源翻译任务,由于缺少大规模的平行语料,可能导致模型对双语句法差异学习不充分,翻译效果不佳.句法的依存关系对译文生成有一定的指导和约束作用,因此,该文提出一种基于依存图网络的汉越神经机器翻译方法.该方法利用依存句法关系构建依存图网络并融入神经机器翻译模型中,在Transformer模型框架下,引入一个图编码器,对源语言的依存结构图进行向量化编码,利用多头注意力机制,将向量化的依存图结构编码融入到序列编码中,在解码时利用该结构编码和序列编码一起指导模型解码生成译文.实验结果表明,在汉越翻译任务中,融入依存句法图可以提升翻译模型的性能.
其他文献
机器译文自动评价是机器翻译中的一个重要任务.针对目前译文自动评价中完全忽略源语言句子信息,仅利用人工参考译文度量翻译质量的不足,该文提出了引入源语言句子信息的机器译文自动评价方法:从机器译文与其源语言句子组成的二元组中提取描述翻译质量的质量向量,并将其与基于语境词向量的译文自动评价方法利用深度神经网络进行融合.在WMT\'19译文自动评价任务数据集上的实验结果表明,该文所提出的方法能有效增强机器译文自动评价与人工评价的相关性.深入的实验分析进一步揭示了源语言句子信息在译文自动评价中发挥着重要作用.
本试验旨在研究饲粮中添加不同水平β-胡萝卜素对母兔生长性能、抗氧化能力、生殖激素指标及卵泡发育的影响.选取55~60日龄、体重[(1.679±0.114)kg]相近、健康状态良好的母兔160只,随机分为4组,每组20个重复,每个重复2只.对照组饲喂基础饲粮,试验组分别在基础饲粮中添加15、30、45 mg/kgβ-胡萝卜素.预试期7 d,正试期84 d.结果表明:1)饲粮中添加不同水平β-胡萝卜素对母兔的终末体重、总增重、平均日增重、平均日采食量以及料重比均无显著影响(P>0.05).2)与对照组相比,饲
该文提出了一种字形相似度计算方法,旨在解决汉字中相似字形(称作形似字)的识别和查找问题.首先,提出了汉字拆分方法,并构建了偏旁部首知识图谱;然后,基于图谱和汉字的结构特点,提出2CTransE模型,学习汉字实体语义信息的表示;最后,将输出的实体向量用于汉字字形的相似度计算,得到 目标汉字的形似字候选集.实验结果表明,该文所提出的方法对于不同结构汉字的字形相似度计算有一定效果,所形成的汉字部件组成库,为之后字形计算的相关研究提供了行之有效的数据集.同时,也拓宽了 日语等类汉语语言文字字体相似度计算的研究思路
本试验旨在揭示桑叶多糖(MLP)对免疫抑制小鼠肠道损伤和微生物多样性的调节作用,初步阐明其作用机制.选择体重(20.0±0.5)g的5周龄雄性BALB/c小鼠60只,随机分为正常对照组(NC组)、环磷酰胺模型组(MC组)、桑叶多糖低剂量组(MLPL组)、桑叶多糖中剂量组(MLPM组)、桑叶多糖高剂量组(MLPH组)和药物对照组(LM组),每组10只小鼠.各组小鼠腹腔注射80 mg/kg BW环磷酰胺(除NC组外),每天1次,连续3 d,以诱导免疫抑制.第4天开始MLPL、MLPM、MLPH和LM组小鼠每天
本试验旨在探讨百里香酚与迷迭香酸组合对脂多糖(LPS)攻毒大鼠生长性能、炎症反应和肠道健康的影响,为百里香酚与迷迭香酸组合在动物生产方面的开发和应用提供参考.试验选取40只21日龄SD大鼠,随机分为4组,分别为对照组(Con组)、百里香酚组(Thy组)、迷迭香酸组(Ros?A组)、百里香酚×迷迭香酸组(Thy×Ros?A组),每组10只(公母各占1/2).Thy组、Ros?A组和Thy×Ros?A组每天分别按照20 mg/kg BW百里香酚、20 mg/kg BW迷迭香酸、10 mg/kg BW百里香酚+
本试验旨在以小鼠为模型探究摄食节律在高脂饲粮(HFD)诱导的代谢综合征(MS)中的作用.将健康的雄性小鼠分为4组,每组5只,连续3个月分别给予含4%脂肪的普通饲粮(Con组)和含10%(10%HFD组)、45%(45%HFD组)、60%(60%HFD组)脂肪的HFD,每周记录小鼠体重,收集血清、肝脏等标本检测生物标志物.为了进一步探究HFD对摄食节律的作用,将另一批小鼠分为Con组与45%HFD组,第1周2组小鼠均饲喂普通饲粮,第2周和第3周Con组继续饲喂普通饲粮,HFD组则饲喂含45%脂肪的HFD,每
话题分割是自然语言处理领域的经典任务之一,其目标是将输入的篇章分割成语义连续的段落.先前的工作使用基于词频、隐式、序列以及Transformer的方法来编码句子,忽略了对篇章整体语义信息的建模.因此,该文采用篇章结构图网络编码句子,获得具有篇章全局信息的句子表示用于话题分割.具体地,该模型首先为每一个篇章单独建图,其中包含篇章的所有句子和单词节点以及它们之间的邻接信息.然后,模型使用门控图神经网络对图进行迭代,得到包含篇章全局信息的句子表示.它们被进一步送入Bi-LSTM层以预测话题分割点.实验结果表明,
前沿相关研究将相似问句识别转化为二元问句匹配识别并取得很大进展.但是在自动问答系统的实际应用场景中存在大量数据,这些方法受限于二元问句匹配识别模式,导致时效性不高.针对这一问题,受人脸识别相关研究的启发,该文提出基于语义空间距离衡量的相似问句识别方法(Semantic Space Distance Method,SSDM).该方法将相似问句识别作为多分类问题进行训练,通过利用人脸识别任务中Margin Softmax损失函数得到语义编码模型.该语义编码模型能够将相似问句在语义空间中聚合,不相似问句在语义空
城市地下综合管廊包括电力、通信、燃气、供热、给排水等各种基础功能的城市工程管线.工程本身具有统一规划、统一设计、统一建设和统一管理的特征,随着互联网技术与通信技术的发展,城市管廊施工中开始体现出对BIM技术的应用,也为5G技术在其中的应用提供了多种可能.文章指出5G技术在BIM+城市管廊施工中最突出的价值表现为能够大幅提高各类数据的实时传输效率,突破管理工作在时空条件上面临的局限,提升工程管控效率,还能为工程提供实时且精确的工程数据.
本试验旨在研究硼对大鼠肝脏显微结构、肝糖原含量、抗氧化功能及细胞增殖和凋亡相关基因表达的影响.选用100只清洁级健康的(22±2)日龄雄性SD大鼠,适应性7 d后随机分为10组,每组10只.对照组饮用蒸馏水(硼含量为0),试验组分别饮用硼含量为5、10、20、40、80、160、320、480、640 mg/L的蒸馏水.试验期60 d.结果表明:1)与对照组相比,饮水补充5、10和20 mg/L硼可明显改善肝脏显微结构,肝小叶轮廓更加清晰,肝细胞索排列更加整齐,双核肝细胞数量增多,肝枯否氏细胞数量增加,进