融合预训练模型的文本摘要方法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:csnzz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大数据时代,信息数据呈现爆发式增长态势。能够高效地、准确地、精简地从海量数据中获取重要和关键信息的自动文本摘要技术应运而生。文本摘要提取方法主要有生成式和抽取式两种。生成式摘要能够通过理解原始文本的语义信息和关键内容,重新用简练的文字将信息表达出来。抽取式摘要通过直接从原文中抽取重要句子或者短语重新组成摘要。目前效果表现较好的生成式方法仍旧存在着难以抓取关键信息和生成高质量摘要等缺点,且处理长文本的能力较差。因此,本文基于深度学习技术改进生成式模型,之后又针对长文本,提出“抽取+生成”的两阶段摘要方法。本文的研究主要体现在以下两个方面:1.提出了一种融合BERT和卷积门控单元的生成式文本摘要方法CBC。受益于预训练模型在语言理解领域的发展,在编码器端,使用经典预训练模型BERT编码序列,其输出的向量包含有更多的语义语法信息。然后,再由卷积门控单元对向量进一步过滤,提取关键信息,排除冗余的信息。在解码器阶段,基于普通Transformer解码器,再设计两种不同解码器,探讨使模型能够生成更准确的文本摘要方法。2.结合CAIL司法摘要的长文本数据集,分析法律文本的特点,提出两阶段的摘要生成模型。在第一个阶段抽取式方法中,使用特征提取能力较为优异的预训练模型Ro BERTa,将句子映射为句向量表示,然后输入到句子提取器DGCNN和Transformer的组合模型中,通过两个模型的训练,计算句子分数,最后筛选出与真实摘要达到最高相似度的关键句子。生成式阶段输入抽取获得的句子,通过优化的生成式模型CBC编码,获取句子的重要信息,再生成准确精炼的司法摘要。生成式模型分别在中文LCSTS数据集和英文CNN/Daily Mail数据集上进行仿真实验和对比,前者实验结果表明,所提出模型在ROUGE评价指标上比当前主流的中文生成式模型效果好。后者实验结果表明,所提出模型在英文数据集上优于基于基础BERT模型的生成式摘要。对于两阶段的长文本摘要模型,在CAIL司法摘要数据集上的实验表明,两阶段的摘要模型在ROUGE指标上有较大提升。
其他文献
同时具有高时间分辨率和高空间分辨率的遥感图像对于监测地表异质景观至关重要。然而,由于卫星传感器硬件技术以及发射预算等因素的限制,获取具有高时空分辨率的遥感图像并不容易。这使得国内外的研究学者将目光集中到对现有卫星观测数据进行后处理,从而获取所需的高时空分辨率数据。在深度神经网络中,相对于图像的一些基本属性:颜色、纹理、形状等特征,深层特征即通过设计网络模型来挖掘图像更为抽象、更高级的特征。在时空融
学位
车云计算是云计算技术在车载网上的扩展,旨在利用车辆闲置的计算、存储等资源构建成云为车辆提供实时服务,保证车辆决策的实时性和有效性,实现智能交通管理,提升交通效率及安全性。然而车云具有高度的动态性和自组织性,如何安全匿名且高效地构建车云以及保证云用户的隐私是一个挑战。目前已有的研究方案中存在车辆的隐私保护问题或是构建车云的方案效率不高。本文重点研究在保护车辆身份隐私及位置隐私的情况下高效地构建车云,
学位
随着数据量的爆炸式增长,数据中蕴含的知识信息也越来越复杂多元化。因此,如何从海量数据信息中有效地挖掘出知识成为了当今学者研究的一大热点问题。知识发现一直都是大数据技术下的一个主要研究点之一,基于概率粗糙集的三支决策就是一种典型的知识发现算法,一个作为解决复杂问题和不确定性问题的三分而治模型,并且结合多粒度思想构建的序贯三支决策模型,能很好地实现复杂问题的动态决策的效果。然而,在实际决策中,当没有决
学位
随着云原生时代的到来,Kubernetes和容器技术已经成为云计算领域的主流技术。Kubernetes因其实现了对容器的服务发现与调度、负载均衡、服务自愈、弹性扩缩容和存储卷等功能,被作为容器管理平台的首选。虽然Kubernetes具备丰富的容器管理功能,但是它并不会考虑容器运行过程中的成本问题以及整体Pod之间的关系,也不具备重调度机制来节省成本。为此,本论文提出了基于Kubernetes的成本
学位
古文物承载着人类文明千年以来的历史文化和精神内涵,对研究古代经济、文明等方面起到至关重要的作用。通过将古文物进行数字化处理,从二维图像转换为三维模型的形式能够有效地减少实体展览所带来的空间和时间上的资源损耗,同时能够使人们能够通过网络的形式以三维的角度更全面地去了解并学习古代文物所蕴含的历史文化。不同于传统的三维重建方式,基于深度学习的三维重建方式更适用于单视图的情况,同时能够在不需要复杂的图像处
学位
随着计算机和三维扫描设备越来越快速的发展,三维几何模型也逐渐成为表达数字媒体信息的方式。点云作为三维模型主要表达方式,其应用场景也越来越多,但是原始点云占用空间较大,而且含有噪声,不适合直接进行使用。骨架可以理解为三维模型精简之后的表示,只需要原始三维模型的部分信息,就可以表达三维模型全局信息。因此,从三维点云数据中分离出可靠的骨架是非常重要的。目前基于深度学习的骨架提取方法主要针对二维图像,针对
学位
随着互联网的飞速发展,网络用户越来越多,社交媒体已经在人们的生活中占据了重要的地位,网络舆情的监管也变得越来越重要。如何分析群众的情感变化,如何挖掘民众关心的热点话题,已成为研究人员的重要研究课题。然而传统的舆情分析方法无法直观地表达文字背后的潜在信息,这就需要数据分析和可视化技术的结合。针对以上问题,本文提出了一种面向新冠肺炎舆情的可视分析方法,可以有效地帮助用户进行微博舆情分析。本文主要做了如
学位
视频逐渐成为当今主流的传播媒体,而海量的视频数据会给视频内容的审核带来巨大的挑战,因此使用计算机去识别视频中的行为具有重要的意义。此外,计算机可以处理多模态数据,完成人体行为识别任务,其中处理骨骼数据的方法具有计算量小、对光照变化鲁棒性强,动作表达能力强等特点。目前,使用基于图卷积网络的人体行为识别已成为一种新兴趋势。然而,如何准确的判断所属行为类别仍是人体行为识别技术的一个难点。本文在对人体行为
学位
在现实世界中大规模的图像数据集往往是呈现为长尾分布的,少部分的头部类别占有大量的样本,而大部分的尾部类别只有少量的样本。目前针对农作物叶部病害识别的研究大多数在类别均衡的平衡数据集基础上进行的,而现实生产中的农作物叶部病害样本分布却大多呈现为长尾分布的状态。卷积神经网络是图像识别领域的关键技术,而数据的长尾分布会使卷积神经网络性能大幅下降。本文针对长尾识别问题和农作物叶部病害识别的特点,主要进行了
学位
食品安全对人们的身心健康至关重要,快捷、精准、灵活和直观的检测方法是保障食品安全的重要手段。聚集诱导发光(aggregation-inducedemission,AIE)材料是近年来提出的一种新型荧光材料,该材料具有可调节的光学特性、良好的光学性能及较好的抗干扰性,并以背景值低、信号强度高的优势在食品安全检测领域展现出广阔的应用前景。四苯乙烯(tetraphenylethylene,TPE)是最具
期刊