生成式自动文本摘要方法研究

来源 :广西师范大学 | 被引量 : 0次 | 上传用户:atznm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
技术是指利用计算机从文章中提取一句话(或一段话),以概括原文意思,有效地提炼原文有用信息的技术。该技术可以帮助人们在当下的信息爆炸时代更好地从互联网获取有效信息,提高工作效率。与传统的抽取式自动文本摘要技术不同,生成式自动文本摘要技术更接近人的思想,更具有研究价值。得益于深度学习技术的发展,生成式自动文本摘要技术成为了新的研究趋势,并取得了一系列新的进展与成果。尽管生成式自动文摘技术已取得令人瞩目的成绩,但它仍存在两个主要的问题有待解决,第一,事实一致性问题,是指生成式文本摘要文本的描述中,出现与原文事实不符的现象。第二,受限于文字的长距离依赖问题,生成式自动文本摘要模型对于长文本的处理还没有较好的解决方案。本文设计了两种深度神经网络模型,分别研究文本的结构化信息对事实一致性问题的解决是否有帮助,以及依存树是否能帮助模型学习文字的长距离依赖关系。具体如下:(1)基于实体关系的生成式文本摘要指针生成网络。该模型首先对原文档中的实体关系进行抽取,然后使用信息丰富型实体关系选择算法选出包含信息量最多的实体关系三元组,并将三元组构建原文的实体关系知识图谱,接着使用基于实体关系的图注意力神经网络学习实体关系知识图谱的特征,同时使用实体关系注意力方法对原有的注意力机制进行增强,增加文本中实体分词被选中输出的概率。(2)基于依存树的图注意力Transformer网络。该模型在经典的Transformer模型上进行了改进,使用了图注意力神经网络以学习文本句子中的语法结构和分词之间的长距离依赖关系。本文在多个英文和中文数据集上对模型的有效性进行了验证,并对模型中的各个模块进行了消融实验,实验结果表明,使用图神经网络学习文本中的结构化信息特征,可以有效地提高生成式自动文本摘要模型的性能。
其他文献
《保健功能释义(健康教育核心信息)》提出:“脑和神经系统通常从膳食获取必要的营养物质,缺乏这些营养物质不利于生命早期脑和神经系统的发育,影响正常认知功能的发挥。因此,改善与记忆有关膳食营养物质的供给可起到辅助改善记忆的作用”。研究表明,天麻具有较好的神经保护、改善阿尔茨海默症、改善失眠、抗癫痫等作用,并在2019年被纳入食药物质试点名单中,已在我国贵州、云南、四川、重庆、安徽5个省份开展了食药物质
期刊
缬氨酸是一种功能性氨基酸,具有调控蛋白质合成、脂质代谢、葡萄糖代谢、抗氧化防御和免疫等生物学功能。缬氨酸添加是开发畜禽低蛋白日粮的重要手段之一,其在促进畜禽生长、调节畜禽泌乳和产蛋等方面发挥着重要作用。本文通过总结国内外最新研究现状,阐述了缬氨酸的来源、分类、代谢途径、与其他氨基酸之间的相互作用、生物学功能及其在单胃和反刍动物日粮中的应用研究进展,提出目前缬氨酸在畜禽日粮应用中存在的问题,为缬氨酸
期刊
目的探讨代谢综合征及其组分与甲状腺结节发病率的关系。方法本研究为前瞻性队列研究。分析来自中国糖尿病患者恶性肿瘤发生风险的流行病学研究贵阳分中心的数据,基线数据于2011年5月至2011年8月通过整群抽样抽选贵阳市云岩区中40岁及以上常住居民共10140名,并在2014年对以上对象进行随访,通过排除标准筛选后最终纳入6783名基线及三年后随访资料完整的居民为研究对象。基线时对所有研究对象采用问卷调查
学位
学位
目的:本研究旨在探究半胱氨酸丰富跨膜成骨蛋白调控因子1(Crim1)对病理性肥大心肌IK1和Ito离子通道编码基因Kir2.1及Kv4.2 m RNA和其蛋白表达的调控作用。方法:1d龄Sprague-Dawley乳鼠心室肌细胞,培养48 h后用血管紧张素II(Ang II;终浓度0.1μM)、氯沙坦(Los;终浓度10μM)分组干预:(1)Con组:不予以药物干预,继续培养24h;(2)Ang
学位
在经济全球化的背景下,国内外企业之间的竞争越发激烈,导致企业获取新客户的成本愈发高昂,而减少长期客户的流失能够有效的增加公司的利润,因此,公司正在将重点从获取新客户转移到保留现有客户群。准确的客户流失预测有助于公司找到潜在的流失客户来减少损失,因此被认为是营销重点。但客户流失在许多行业内都是小概率事件,这意味着公司中留下的客户数量远远超过了流失客户的数量,因此,客户流失预测可以归属于不平衡数据的分
学位
舵机转向结构是水域救援无人船中关键的组成部分。针对现有的舵机转向结构设计经常导致船舱内部容易进水等缺点,设计了一种能够防止船舱内部进水的新型水域救援无人船舵机转向结构,该转向结构具有设计简单、操作控制方便等特点。
期刊
三维点云处理技术是三维建模与计算机视觉重要的研究课题之一,该技术应用于生活的方方面面,例如自动驾驶、虚拟现实、文物修复、机器人视觉定位等。其中,点云配准是一项重要的点云处理技术,由于点云采集设备只能从多个单一视角获得部分点云数据,需要利用点云配准方法通过空间变换将部分数据合成为完整点云。点云配准根据点云之间的相对位置分为全局配准和局部配准,本文从全局配准的基于特征提取的方法和基于概率密度函数的方法
学位
目的:探讨心脏代谢指数(Cardiometabolic Index,CMI)和其他体脂评价指标[体质指数(Body Mass Index,BMI)、腰围(Waist Circumference,WC)、腰高比(Waist-to-Height Ratio,WHt R)、脂质蓄积指数(Lipid Accumulation Product,LAP)]与代谢综合征(Metabolic Syndrome,M
学位
报纸