基于深度学习的摘要生成技术研究

来源 :沈阳航空航天大学 | 被引量 : 0次 | 上传用户:yaoyie
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的高速发展及移动客户端的普及,人们越来越依赖于通过互联网来获取信息,文本信息过载问题日益严重,因此如何高效准确的获取信息变得尤为重要,文本摘要便是其中一个重要手段。本文在先前的研究基础上进一步探索,并提出了相应的改进算法,主要包括以下两个方面:(1)鉴于中文n-gram蕴含着丰富的局部上下文信息,本文提出一种将n-gram信息整合到现有模型的神经框架Ngram Sum。该框架以现有的神经模型为主干,从本地语料库提取n-gram信息,并提出了一个局部上下文视野感知增强模块和一个门模块来分别对这些信息进行编码和聚合。实验结果表明:该框架有效增强了基于LSTM,Transformer,预训练模型三种不同层次的序列到序列强基线模型,其中ROUGE-1/2/L较之基线模型平均分别提高了2.76,3.25,3.10个百分点,进一步的实验和分析也证明了该框架在不同n-gram度量方面的鲁棒性。(2)本文提出一种通过依存句法信息增强上下文语义表征的生成式摘要框架SDSum。该框架利用图卷积神经网络建模依存句法信息,并通过一个融合模块将编码端的上下文信息进行整合。实验结果表明,SDSum可以进一步提取句法结构深层信息,并可以通过恰当的融合模块将其整合,无论是基于随机初始化的Transformer还是预训练BERT做编码器的摘要系统,较之其基线模型ROUGE-1/2/L平均分别提高了0.72、0.94、1.03个百分点。最后,设计并实现了基于深度学习的文本摘要生成系统。该系统可以依据输入的文章进行摘要生成,并且支持移动端多用户同时访问,提供了局部上下文视野感知增强和依存句法信息增强两种摘要生成方式。
其他文献
建筑外墙火灾是城市灾害之一,燃烧物多为外墙有机保温板。水喷淋作为目前一种成熟的灭火技术,对火势的发展有很好的抑制作用,但是其对高层建筑外墙火灾防控的工程应用还不常见,探究水喷淋对外墙火灾灭火规律对外墙水喷淋发展具有重大意义。本文采用实验研究与理论分析相结合的方法,以典型外墙保温材料聚苯乙烯为例,建立小尺寸燃烧试验台,通过改变喷头水平距离、倾斜角度研究水喷淋系统单个喷头对竖向火灾的灭火规律及保护范围
学位
病案记录了患者的整个诊疗过程,是非常重要的医学资料,在医疗质量管理、诊疗水平提升、临床教学和科研上都有举足轻重的作用。纸质病案和病案数字化为医疗大数据挖掘提供了良好基础,目前,越来越多的研究聚焦在如何从病案文本中抽取具有潜在价值的医疗信息。其中,医疗命名实体识别任务旨在识别病案文本中具有特定意义的实体,主要包括疾病和诊断、实验室检验、手术、药物、解剖部位与影像检查等,该任务可以为智能问诊、临床决策
学位
随着信息社会的进一步发展,越来越多的行业采用复杂事件处理技术来对海量的事件流进行实时的监测与分析。目前在复杂事件处理领域已经有了很多研究成果,先前的研究主要集中在事件处理语言、事件过滤、事件监测等相关技术。而当前的复杂事件处理系统往往要求在实时约束条件下并行处理数百个甚至数千个由用户定义的查询。在多复杂事件处理的优化问题上,研究人员往往基于经典的复杂事件监测模型的基础进行上层的多查询的优化。例如在
学位
报纸
将政府办医与社会办医对立起来,不仅会使医疗卫生资源难以得到有效配置,也会使社会办医畸形发展。文章认为,政府办医和社会办医统一于社会主义医疗卫生制度中,都是中国特色社会主义医疗卫生资源不可分割的重要组成部分。把握中国特色社会主义医疗卫生资源性质,切实推进医疗卫生资源社会化,既是推进医疗卫生资源合理有效配置的客观需要,也是落实分级诊疗、推进健康中国建设的内在要求。当前,在推进医疗卫生资源社会化过程中,
期刊
计算机博弈,也被称为机器博弈,其本质是期望计算机能够和人一样做出智能的决策。计算机博弈作为人工智能领域最富有挑战且十分重要的一个研究方向,对人工智能学科的发展起到推动作用。近年来,随着深度强化学习的快速发展,以Alpha Go为代表的博弈智能体取得了举世瞩目的成就,不仅促进了机器博弈理论与技术的进步,同时对人工智能的发展产生了深远的影响。藏久棋作为一种完备信息博弈的棋类游戏,主要流行于我国藏民族地
学位
工艺过程自动生成一直是计算机辅助工艺设计追寻的目标。但限于强专业性、复杂逻辑、少数据等问题,派生、规则、本体与浅层神经网络的方法受到了诸多挑战,效果与实用性不佳。在此背景下,本文开展了基于深度学习的小样本工艺过程生成研究,具体包括:针对现有工艺过程生成方法对于不同专业适用性较差的问题,提出一种基于深度学习编码器-解码器的工艺过程生成方法。该方法利用工艺大纲文件数据,通过编码器提取工艺属性特征,解码
学位
文章借助超效率SBM模型、ESDA模型、Malmquist指数模型、固定效应模型分析了我国中医医院公共医疗服务效率的时空演化特征和影响因素。结果显示,我国中医医院医疗服务综合效率整体处于中等水平,地区间差异较大,TFP年均下降1.9%,效率值呈现空间集聚。医师日均担负诊疗人次数、日均担负住院床日、病床使用率和人均GDP对医疗服务综合效率有正向影响。应推进中医医疗资源均衡布局,推动医疗服务和管理模式
期刊
互联网技术的快速发展催生了大数据时代的到来,数据在积累的过程中常常伴随各种类型的数据错误,其中不一致错误就是最常见的一种。针对数据中的不一致错误,现有数据修复方法分为子集修复和更新修复两种,大多基于完整性约束规则,采用最小代价原则,通过删除或更新少量元组使得数据一致。然而当数据中的错误较多时,这种方法的准确率将大大降低。为此,本文提出规则与概率相结合的混合式数据修复方法,利用概率统计信息指导错误修
学位
随着智能交通系统越来越普及,车辆用户产生大量的数据需求。近年来,大量的研究人员聚焦于如何解决车辆用户获取请求内容的问题,但这些研究都缺乏不同网络环境对用户体验质量(Quality of Experience,Qo E)影响的思考。本文针对不同网络环境提出了网络质量好的环境下的智能化边缘缓存策略和网络质量差的环境下的智能化边缘缓存策略。首先,针对网络质量好的环境下车辆的高速移动性导致的车辆在基站之间
学位