基于神经机器翻译方法的英语语法错误纠正研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:mxhdb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语法错误纠正,目标是利用计算机程序自动地纠正书面文本中存在的语法错误。目前,主流的方法将其看作一个单语翻译任务,纠错就是将“错误”句子翻译成“正确”句子的过程。本文分别从模型、训练算法、数据增强三个层面着手,研究升语法错误纠正性能的方法。(1)绝大部分语法错误发生在文本中某一局部,但也有一小部分语法错误跨越文本中的多个片段。我们使用当前神经机器翻译中最为先进的编码器-解码器模型——Transformer建模语法错误纠正,以兼顾文本中的局部上下文信息和长距离依赖关系。在两个标准数据集上的实验结果表明,Transformer显著地优于基于循环神经网络或卷积神经网络的模型。(2)典型的神经机器翻译面临着曝光偏差、损失评估失配等问题。此外,自动评价指标往往不能完全真实地反映模型的性能。我们出了一个面向语法错误纠正的对抗学习框架,在该框架中,包含一个判别器和一个生成器。给定错误句子,判别器负责区分某一纠正句子来自模型输出还是人工标注,而生成器的目标是生成“以假乱真”的纠正句子以欺骗判别器。通过让两者相互对抗,促使生成器生成与人类表达更为接近的纠正句子。我们借助强化学习中的策略梯度方法来克服由自然语言文本的离散特性带来的优化问题。实验结果表明,我们出的对抗学习框架能在句子层面升模型输出的纠正句子的流利度。(3)目前,语法错误纠正面临着较为严重的数据稀疏问题,这给机器翻译方法在该任务上的应用带来了直接的困难。我们基于back-translation数据增强方法合成伪”错误-纠正”平行句对。为了引入具有多样性的语法错误,我们首次出在back-translation阶段采用sampling解码构造伪句对,并对比了基于不同解码策略合成的伪句对给训练正向语法错误纠正模型带来的影响。进一步地,我们使用自创的对抗学习框架,升back-translation中反向语法错误生成模型的性能,从而构造出更高质量的伪句对,以帮助正向模型的训练。实验结果表明,我们的方法能合成有效的伪句对,从而升语法错误纠正的性能。
其他文献
学生是学习的主体,学生必须参与课堂活动.我国艺术本科生在英语课堂上缺乏积极参与,其中主要原因是本身的英语语言水平、文化基础薄弱,本科层次教材对他们来讲难度较大.为提
全地行车是金华的特色产业,然而由于欧美经济不景气,全地形车出口面临冲击,金华检验检疫局竭力帮扶辖区全地形车行业稳定健康发展。
杜平让近年来一直致力于工笔重彩画的创作。他的一批精心之作引起了广泛的注目和好评。他的花鸟画不随波逐流,不讲传派,有自己的风格面貌,这是一位画家十分难能可贵之处。他
期刊
随着知识经济时代的到来,知识竞争日益激烈,这对教育事业提出了更高的要求。在日常教学中,教师必须注重对学生科学探究能力的培养,而这一过程不是一蹴而就的。本文依托原始物
以不同含量(0.25%,0.5%及0.75%)的石墨烯纳米片(GNP)改性环氧树脂胶黏剂,分别通过未改性及改性后的环氧树脂胶黏剂制成单搭接胶接结构,对比研究改性前后的环氧树脂胶黏剂的拉
<正> 晚近文献报导精分患者血清中有抗大脑膈区和尾状核神经细胞核的抗体,为此我们用通常检测自身抗体的方法,检测临床诊断明确的精分患者血清中的抗DNA抗体。兹将抗DNA抗体
<正>在几千年的社会发展中,文化作为一种精神力量,能够在人们认识世界、改造世界的过程中转化为物质力量,对社会发展产生深刻的影响。这种影响,不仅表现在个人的成长历程中,
城市商业综合体是城市急速发展产生的功能复合型建筑,它能最高效的利用土地并实现城市价值的最大化。在当今消费社会的背景下,商业综合体中介空间以其丰富多变的空间形态,扮演着商业空间和城市空间协调者的角色,它不仅是商业综合体各种复合功能之间的粘合剂,也是商业环境氛围营造的催化剂,同时,它更是城市市民公共活动的重要场所。本论文从中外研究理论、城市背景下的商业综合体中介空间特征与职能、商业综合体中介空间形态类
文章探讨了在新形势下加强企业文化建设,助推企业健康发展的具体措施。要提高认识,加强领导,为推动企业文化建设提供组织保障;丰富载体,广泛宣传,全面掀起企业文化建设热潮;紧抓落实
4月7日,中国汽车工业协会摩托车分会全地形车委员会(以下简称:全地形车委员会)2011年会在南京召开,中国汽车工业协会摩托车分会秘书长李彬,全地形车委员会执委会主任委员、江苏