一种简单的神经机器翻译的动态数据扩充方法

来源 :厦门大学学报:自然科学版 | 被引量 : 0次 | 上传用户:whoelse
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
反向翻译作为一种用于神经机器翻译的数据扩充方法,被广泛应用于单语数据的训练.然而,这些方法通常需要大规模源端或目标端单语数据、双语词典等.基于此,提出了一种在不引入外部资源情况下的简单数据扩充方法.该方法在每次加载目标端句子时,按照一定策略对句子中单词进行随机噪声化,以实现原始平行数据目标端的动态数据扩充,从而提高目标端语言模型对句子的表达能力.不同于需要大量单语数据的反向翻译,该方法只使用平行语料.这一策略意味着不需要训练额外的逆向模型.在英德和中英翻译任务上的实验结果表明,该方法使标准Transfor
其他文献
[背景]金黄色葡萄球菌作为一种条件致病菌,在临床感染中扮演着重要的角色,需要研究更多更有效的防治手段.[目的]分离金黄色葡萄球菌噬菌体,研究其生物学特性,从而为金黄色葡
空中纺线(AS)法主缆纺丝时,钢丝通过绕过锚靴进行锚固,锚靴的半径通常较小,此时钢丝会产生较大的弯曲应力.为了对锚靴位置钢丝的受力安全性能进行分析,首先,采用单根无应力钢
化学作为高中教育阶段的重点科目之一,对于训练学生理科思维、提升学生自主学习能力作用显著.在本文中,笔者将联系实际的高中化学教学和在学生中开展工作的反思体会,分析一下
识字是小学生学习文化的起点,是他们接触语文这门学科的基石.中国汉字在其历史之上有着几千年的文化,其博大精深.而且目前我国人均语文水平和文化程度都极高.因此,根据教育部
语言表达是学生在语文学习过程中应该具备的一种能力.表达能力不仅是学生语文学习能力的体现,同时也能影响到学生的各科学习效率以及性格发展.语言表达能力除了善于言谈之外,
针对钢桥病害识别效率低、精度不高的现状,提出了一种基于深度学习的钢结构表观病害识别方法。该方法将卷积神经网络Inception-v4和迁移学习相结合,分别采用迁移学习中特征提取和微调2种训练方式获得2种模型,并与全新训练的Inception-v4模型进行对比。首先,收集656幅钢桥病害图像,包括涂层劣化176幅,腐蚀173幅,焊缝开裂151幅,完好156幅,对其进行旋转、翻转、调整对比度等预处理,
在新的基础教育课程改革不断推进、不断深入的过程中,初中语文教学在教学模式、教学方案、教学目的等多个方面都发生了巨大的改变.现阶段的初中语文教学更加重视学生的基础素
神经机器翻译在高资源情况下已经获得了巨大的成功,但是对低资源情况翻译效果还有待提高.目前,维吾尔语-汉语(维汉)翻译和蒙古语-汉语(蒙汉)翻译都属于低资源情况下的翻译任
当前基于自注意力机制的神经机器翻译模型取得了长足的进展,但是采用自回归的神经机器翻译在解码过程中无法并行计算,耗费时间过长.为此,提出了一个采用非自回归的神经机器翻
为探究规范公式在计算空间钻石形桥塔塔肢偏心距增大系数时的适用性,并保证大跨度斜拉桥桥塔结构配筋设计的合理性,以常泰长江大桥为工程实例,对塔柱偏心距增大系数进行了计