中文生成式摘要模型的OOV和长距离依赖问题研究

来源 :南华大学 | 被引量 : 0次 | 上传用户:hongsx14
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动摘要作为一种文本解析的重要工具,它可以从海量数据中提取出文本的主题信息,实现从冗余文本到简洁文本的快速转换。得益于深度学习技术在自然语言处理(Natural Language Processing,NLP)领域的快速发展,使得基于深度学习技术的生成式摘要已经成为现阶段摘要技术的研究热点。对于生成式自动摘要而言,其是一种序列到序列(sequence-to-sequence,seq2seq)的模式,而将注意力机制(Attention Mechanism)融合到seq2seq以实现对输入序列中某些词的重点关注,称之为seq2seq+attention框架。因此,本文以seq2seq+attention框架为基础,融入复制机制和Input-feeding方法来改善原始模型的OOV(Out-of-Vocabulary)以及注意力决定准确率的问题。同时引入Bert预训练语言模型和Transformer模型以改善句子的长距离依赖问题。本文的主要研究内容如下:(1)考虑到seq2seq+attention框架在生成摘要时需要先构建一张词表,神经网络通过自主学习后,从该词表中选取概率最大的词作为输出。但是由于该词表是固定的,导致许多不在词表之外的词无法有效生成,即出现了OOV问题,因此使用了复制机制来改善上述问题,通过复制机制来动态的改变词表,将源序列中的词也考虑进来,使得输出的摘要中可以包括更多的非词典中的词;接着,由于原始模型中每个时刻的注意力决定在每个解码时刻都是相互独立的,从而引入了Input-feeding方法将每个解码时刻的注意力决定相联系起来,使得每个解码选取的词更加准确。(2)RNNs(LSTM或GRU)模型并没有从真正意义上解决长距离依赖的问题,因此引入了Bert+Transformer来改善该类问题。该部分分为对Bert微调(fine-tuning)和Transformer来实现两个阶段生成摘要。第一阶段,通过Bert来学习文档级别的特征,以获得更多的语义和语法等信息,实现了对摘要句的抽取,这样可以有效缩短源文本的长度;第二阶段,将第一阶段抽取得到的句子集合输入到Transformer模型中,其可以有效改善句子的长距离依赖问题。使用NLPCC2018中文新闻文本数据进行实验,并使用ROUGE作为评价指标,实验结果表明以上的方法与经典的抽取方法和seq2seq+attention模型的结果相比,所有的ROUGE值都得到了提高,验证了上述方法的可行性。在本文的研究工作中没有使用外部知识辅助以摘要的生成,也没有使用Bert改进模型(如ALBert)等内容,但是在今后的工作中可以考虑引入这些方法来改善中文摘要的质量。
其他文献
图像超分辨率重建技术指的是将给定的一幅低分辨率图像通过特定的算法恢复成相应的高分辨率图像。随着人工智能的不断发展,超分辨率重建技术在视频图像压缩传输、医学成像、
固井是石油工程中的重要作业过程。传统振动固井技术由于振源安装在井口或者井底,振动波在阻尼的作用下不断衰减,对井深达数千米的井振动效果不理想。随行振动固井技术,在充
壳聚糖,几丁质的脱乙酰基产物,具有比几丁质更好的溶解性、可降解性和生物相容性。壳聚糖有抑菌、保湿、调节血脂等优良性能,因而在食品、医药等领域有很大的开发和应用潜力
与高级视频编码标准AVC(Advanced Video Coding)相比,高效率视频编码标准HEVC(High Efficiency Video Coding)大大提高了编码效率,这得益于HEVC采用了许多新的编码技术。但是
核退役工作中,拆除机器人通过快换装置可以换装破碎锤、液压剪和抓斗等工具,以对核设施进行破碎、剪切和搬运等工作,是目前代替人工进入辐射环境对核设施进行拆除解体的主要
数据挖掘是一门实用的学科,它根据具体问题应用具体方案,在繁杂的数据中找到规律,给问题的研究人员提供决策辅助。图论是一门研究客观世界中事物间联系的学科。两者相结合,就是希望通过图模型找到具体解决方案,挖掘出客观世界中数据的客观规律。当今社会,越来越多的数据可以抽象成网络结构,从而在图论领域的数据挖掘问题也越来越多,其中就不乏在二分图领域的数据挖掘问题,前人也在这一问题上获得了许多研究成果。本文研究的
伴随着信息的高速传播,经济的快速发展,计算机互联网技术在诸多领域都得到了十分普遍的应用,上世纪七十到八十年代,计算科学进入了教育领域,计算机科学运用在教育中,对传统教
多载频相位编码信号具有众多优良特质,如高分辨、低截获、抗干扰等,因此对这种信号进行系统的性能研究分析是很有必要的。本文是以多载频相位编码信号的信号特性分析以及信号
高超声速推进技术由于其重要的战略地位,在世界各国内得到广泛的研究,随着其技术的日趋成熟,对超燃冲压发动机的智能管理体系提出现实的需求,具体表现在对内部关键参数的测量
高速钢已广泛用于工具、模具、轧辊等行业,随着工业发展,碳与合金元素的含量不断增加,组织中碳化物形貌也由网状向球状不断演化。然而传统工艺制备高速钢存在组织粗大,碳化物