基于新闻文本摘要的突发事件演化分析

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:caizilovenvfei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
突发事件通常会对人类社会及环境造成直接的破坏性和重大影响,因此人民群众对其抱有极大地关注度。且近几十年,突发事件频发,尤其是当下处于疫情时代,突发的公共卫生事件更是备受重视。当今的移动互联网时代,有助于大众及时获取有关突发事件的信息并开展救援等。但同时,网络上信息纷杂,很难使适应碎片化阅读的大众便捷、全面、系统地了解某一事件,尤其是当该事件影响持续时间较长时。因此,从杂乱无章的大量事件文本中抽取出重要信息,并按照时间逻辑顺序,简明扼要地呈现事件发展情况具有现实意义。而从给定文本中提取最重要信息的自动摘要技术是实现该目标的重要研究方向。因此,本文通过对自动摘要技术进行研究,设计实现了SCC-UNILM生成模型,构建了突发事件时间演化序列,并完成了突发事件信息抽取系统的设计与实现。本文主要的工作内容如下:1.本文分析了目前摘要算法存在的问题,针对这些问题以及本文的目的,选用UNILM模型,并在其基础上,融合了拷贝机制,将sparse softmax替代传统softmax,在整体损失函数中加入coverage损失,完成了UNILM生成式算法的改进,提出了SCC-UNILM生成模型。并利用ROUGE评价值作为评价指标,在LCSTS数据集上进行验证,改进的SCC-UNILM模型的表现优于其他基准模型。2.本文主要利用了改进的SCC-UNILM算法,时序生成算法以及消除冗余信息的算法设计了突发事件的时间演化序列的构建方法。其主要由文本预处理模块、文本聚类及去重模块以及突发事件时间演化序列生成模块共三个模块组成。其中突发事件时间演化序列生成模块是核心模块。为了尽可能多的保留有用信息,将文本按照自然段为单位进行摘要生成。又由于构建的是时间序列,那么就需要保证每个段落皆有时间标识。因此,本文设计了时序生成算法。然而,在尽可能多的保留有用信息的同时,也带来了多余的重复信息。所以,本文还提出了结合语义角色标注的句子相似度计算的办法去除冗余信息。最后,再依照事件背景、事件经过、事件影响的结构组织成了完整的事件时间演化序列的构建。3.本文设计了一个突发事件信息抽取系统。该系统包含了文本预处理模块、篇章信息抽取模块以及事件时间演化序列生成模块。主要实现了分词&词性分析、指代消解、语义角色标注、关键词提取、文本摘要生成和事件时间演化序列生成的功能。
其他文献
背景:血管平滑肌细胞(vascular smooth muscle cells,VSMCs)是组成血管壁的主要成分,在正常生理状态下,VSMCs不具有增殖能力,当细胞受到损伤时,VSMCs转化为具有增殖能力的细胞,从而引起管腔狭窄、血管堵塞等问题。环状RNA(Circular RNA,circRNA)在VSMCs表型转化过程中具有重要调节作用,可能参与调节心血管疾病的发生及发展过程。血小板源性生长
学位
2021年发布的《中华人民共和国乡村振兴促进法》明确指出开展乡村文化振兴活动是全面实施乡村振兴战略的应有之意。但实际上,随着城市文化的强势进入,乡村文化已呈现出日渐衰落的趋势,同时,在城镇化和农村教育集中化进程中,农村人口流动性增大,乡村文化建设主体流失,种种原因引发了村民的认同疏离和价值观异化。当这一幕发生在民族地区的乡村社会,这种文化失落似乎更为严重。在此背景之下,本文试图通过分析涉藏地区乡村
学位
无监督视频目标分割是指在未给定任何参考输入信息的前提下,实现前景目标的准确分割,其在视频监控、视频编辑、自动驾驶等场景应用广泛。现有的前沿方法大多需要依靠复杂的深度学习网络结构或光流来提高分割准确性,这往往导致分割效率较低,不能做到实时分割。因此,如何在平衡分割准确性的同时降低模型计算量,以实现高效分割是一个很重要的研究问题。本文从前景目标运动和背景固定的特定运动场景出发,首先研究该场景下的高效分
学位
当前随着中国城镇化建设进程不断推进,农村留守老人增多、文化生活贫乏,甚至自杀,精神问题突显。帮助农村老人找到心灵的归属,减少“空巢”心理,丰富他们的精神文化生活,保证自身的生活生命质量,积极老龄化是当前我国农村老人的迫切需求。相对物质需求,老人精神需求包括渴望情感交流和他人关心,能够参与社会活动排解内心郁闷,当遭受重大变故时有人陪伴心理疏导等等,服务老人精神需求分为精神慰藉、文化体育、权益保障三类
学位
随着大数据时代的到来,人们生活的社会在过去近几年创造了爆发式增长的数据,为视觉处理任务提供了大量的应用场景。硬件平台和计算机技术的结合也表现出了强有力的实力。其中,目标跟踪技术就是重要且复杂的技术之一。目标跟踪主要研究是根据视频的历史图像序列信息预估目标后续的位置。在跟踪过程中,图像特征的实时提取是跟踪算法能够准确、有效地实现跟踪的关键。相关滤波跟踪算法相比于其他跟踪算法是目前综合性能较好的算法之
学位
浅层天然气作为自然资源是当前国内外天然气勘探的热点问题之一,同时,在工程卸荷释放过程中,浅层气会改变地质体的力学结构,诱发工程事故。纳利大桥工程建设过程中遭遇浅层气不良地质,在广西省工程建设尚属首次。本文以《广西省高岭至山寨二级公路纳利大桥浅层气地质灾害调查及处治对策研究报告》项目为依托,通过地质勘探分析桥址区浅层气地层岩性及浅层气的分布特征;同时采集勘探孔内气体、岩石等样品,对采集样品进行气体组
学位
随着药品监督管理工作的不断加强和国内中药产业品质意识的提升,中药材及饮片的质量管控也面临着新的问题与挑战。据《中国药典》2020年版,中药材掺伪掺杂与重金属超标问题将影响中药饮片的安全和有效性,应引起高度重视。对样品复杂的预处理与化学分析等往往是传统中药元素检测的必要步骤,会消耗大量人力物力进行实验。X荧光光谱分析技术(XRF)的实验仅需简单预处理样品,消耗时间短,可复现率高,可对中药材元素的快速
学位
古代采矿的发展与文明进程、社会经济、政治制度的发展密切相关。采矿石器作为人类早期就开始生产使用的器具,从旧石器时代沿用到历史时期,是金属工具大规模使用前用于开采矿物的主要工具,具有重要的研究价值。本文的研究对象是洛南河口绿松石采矿遗址出土的67件采矿石器。其中63件采矿石锤、研磨工具2件、原料2件。通过观察、绘图、摄影、数据统计、岩性鉴定以及微痕观察等方法,对其类型和功能进行研究。研究显示,河口绿
学位
计算机辅助诊断可以减少医生的工作量,提高诊断效率,是未来医疗发展的新趋势。在骨折的诊断过程中,需要判断骨折发生的位置以及骨折类型,以便制定最佳的治疗方式。临床中,由于计算机断层扫描(CT)在骨折类型诊断中具有更高的一致性、产生误判的概率更低等优点,所以一般采用CT影像进行分析。而分型结果往往依赖于观察者的经验与直观印象,容易发生误诊。此外还存在由于数据涉及患者隐私和病症分布不均而无法获取足量样本情
学位
文化遗产是历史给予我们的宝贵财富,2019年起,国家重点研发计划“文化遗产保护利用”专题任务先后启动了36个项目,围绕考古与文化遗产价值认知、文物病害评估与保护修复、文化遗产风险监测与防控、文化遗产传承与利用等四个方面,开展基础研究、关键技术攻关和应用示范。文化遗产的保护与利用已成为当前文物工作的重点内容。与此同时,随着社会的发展,人民的富足,精神食粮愈发重要,文化遗产的展示与利用则是补给的独特方
学位