基于Transformer模型的AMR文本生成研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:longriver0001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
抽象语义表示(Abstract Meaning Representation,AMR)是一种新型的句子级语义表示方法,它将句子的语义表示为一个单根有向无环图。AMR文本生成(AMR-to-text Generation)任务的目标是获取与给定AMR图具有同样语义的句子。随着神经网络在自然语言生成领域中的兴起,序列到序列模型在AMR文本生成任务中也取得了很好的性能。本文围绕基于序列到序列Transformer模型的AMR文本生成展开研究,主要研究内容如下:(1)基于大规模自动标注语料的AMR文本生成研究。由于AMR文本生成可使用的标准数据集规模较小,因此该任务的性能受模型影响较大。针对此问题,本文基于大规模自动标注语料来比较先进模型和基准模型生成文本的性能,在这项工作中,使用序列到序列的Transformer模型作为基准模型。实验结果表明,在大规模自动标注语料的基础上,AMR文本生成在先进模型与基准模型中得到的句子文本的性能没有显著差异,先进模型的性能优势随着训练数据集的增大而减弱。(2)AMR文本生成的数据扩充方法。AMR文本生成的性能在很大程度上受到了语料规模的影响,为了提高AMR文本生成的性能,本文提出了一种有效的数据扩充方法。该方法采取一定策略随机选取目标端加载的句子序列中的单词并引入噪声,实现对目标端数据的动态扩充,提高模型的健壮性。实验结果表明,本文提出的数据扩充方法可以使得AMR文本生成的性能有效提升。(3)融入句法结构信息的AMR文本生成。AMR语义图在生成句子文本的过程中,由于缺乏了句法结构信息的约束,导致生成的句子与AMR语义图对应的标准句子有一定误差。因为Transformer模型能够很好地对句法特征信息进行捕获,受此启发,本文提出了以多任务学习思想融入句法结构信息的方法,提高生成的句子质量。实验结果表明,本文提出的融入句法结构信息的方法可以有效提高AMR文本生成的性能。
其他文献
随着智能手机的普及以及移动互联网的发展,空间众包成为了共享经济时代下传统众包发展的新方向。空间众包的核心操作是任务分配,即将具有时空特征的任务分配给空闲的工人。多个空间众包平台的存在使得合作成为可能,各平台以共享任务与工人的方式进行合作,帮助其他平台完成原本难以完成的任务,从而实现更优的任务分配以及总收益的扩大。此外,空间众包平台也能利用大数据来驱动更智能的任务分配,基于联邦学习技术共享各自的数据
学位
知识图谱问答以结构化的知识图谱作为答案来源回答用户提出的自然语言问题。在已有的知识图谱问答方法中,基于查询图的方法广受关注。基于查询图的知识图谱问答方法包含查询图生成和查询图选择两个主要模块。其中,查询图生成实现问句的语义解析,将问句转换为一组候选查询图;而查询图选择是从候选查询图集合中选出最优查询图,并从知识图谱中检索答案。尽管基于查询图的知识图谱问答方法取得了一定的进展,但其在复杂问句的语义解
学位
“双减”政策强调学校要满足学生多样化的学习需求,制定丰富的课后服务实施方案。作为初中物理教师需要在课后服务中积极开展科普活动、科学社团课。义务教育物理课程标准指出,有效地开发和利用课程资源是切实提高物理教学质量的有效手段。所以在设计新授课、延时服务课时,如何筛选、开发、应用课程资源以加深学生对基础知识的理解、激发学生科学兴趣、拓展科学视野,成为一线物理教师必须解决的问题。国家为提高国民科学素质,除
学位
元学习作为近年来机器学习领域提出的一种新范式,旨在从多个任务中学习经验,从而更快更好地适应于新任务。作为元学习的重要应用场景,小样本学习旨在研究样本稀少情况下学习算法的泛化性问题。目前,研究者们已提出众多有效的元学习算法,使得小样本分类任务的准确性得到提升。然而,我们发现这些算法仍然存在待解决的问题,比如样本数据的复杂性、噪声数据或模型假设所引起的不确定性问题,阻碍了现有模型的进一步提升。针对上述
学位
语义角色标注(Semantic Role Labeling,SRL),又称为浅层语义分析,其目标是识别句子的谓语论元结构,包括句子中的所有谓词,以及谓词相关的论元。首先,为了解决多领域SRL数据集匮乏的问题,本文人工标注了一个较大规模的多来源多领域汉语SRL数据集,进而开展了跨领域SRL方法探索。考虑到语义和句法的紧密联系,本文的另一个重点是如何在跨领域SRL模型中有效地使用句法信息。本文尝试了两
学位
近年来,我国的交通系统飞速发展,各类交通工具不仅丰富了人们的出行选择,也拉近了人们的地理空间距离。与此同时,城市的交通拥堵现象日益严重,不仅增加了人们的通勤成本,还容易导致特大安全事件的发生。为了缓解交通拥堵带来的各种影响,城市路况的精准预测显得尤为重要。其中,交通流预测旨在分析交通流的历史规律,从而推演未来的交通演化情况。本文将重点研究交通流预测技术的发展,分析现有研究方法的优势与不足,并提出针
学位
随着金融交易市场的迅速发展,互联网金融和移动金融逐渐成为投资交易的新型金融业务模式,这给投资者带来了极大便利的同时,也使得金融市场的交易数据呈爆炸式增长。在金融资产的交易过程中,订单流的限价指令信息形成了限价指令簿。投资者能够利用限价指令簿来预测金融资产的价格趋势,并根据预测的结果进行交易决策。目前,限价指令簿趋势预测的主流方法是深度学习方法,其中大部分方法只采用限价指令簿的事实信息,少量方法会兼
学位
场景图生成任务是对图像理解的一种结构化表示形式,这种表示形式不仅可以为基本的目标识别任务提供上下文线索,还可以为更广泛的高级视觉任务提供价值,应用前景十分广泛。针对模型中的单峰偏置问题和数据集中的数据偏置问题,论文首先研究模型单峰偏置缓解,通过引入协同策略来缓解单峰偏置,并基于提出的场景图生成模型展开数据偏置缓解的研究,重点研究了奖惩策略下和类平衡策略下的场景图生成方法。主要工作内容如下:(1)针
学位
捆绑销售旨在向用户推荐捆绑的商品包,具有着重要的营销价值。互联网技术的浪潮推动了对捆绑销售场景的研究,根据不同的捆绑销售场景,将推荐任务划分为商品包推荐、合购者推荐和多任务推荐,并在图神经网络的框架下,推进对这三个推荐任务的研究。主要内容有:(1)针对向用户推荐捆绑商品包的问题,本文提出了模型IHBR。模型根据用户的对捆绑商品的购买意图探究了商品之间的共购、共现关系,使用自注意机制学习商品依赖性,
学位
随着智能移动设备的发展和普及,各种基于位置的服务提供商不断涌现,为用户提供丰富多彩的服务,比如查找最近的餐馆、规划出行路线等。路网最短路径及其距离查询作为各种服务最核心、最高频的操作,它的计算效率极大地影响着服务质量和用户体验。现有的最短路径及其距离查询算法,没有充分挖掘、利用查询和路径的时空信息,算法计算效率不能满足实际应用需求。本文在分析现有工作不足的基础上,深入研究路网最短路径及其距离查询算
学位