基于图的关键短语提取研究

来源 :西南石油大学 | 被引量 : 0次 | 上传用户:sosolinkweixiao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的发展,文本信息呈指数式增长,人们在文本信息处理和阅读中将花费大量时间和精力。关键短语技术是一种可以从文档中快速获取重要信息的方法,能在一定程度上缓解信息爆炸给人们带来的问题,并广泛地应用在了信息检索、文本分类、问答系统等任务中。关键短语技术按照短语的组成方法进行区分,可分为关键短语提取技术(方法)和关键短语生成技术(方法)。提取式方法通过评估原文中短语的重要性得分,从原文中提取出重要的词语组成短语,而生成式方法则利用了前沿自然语言处理技术,从原文中生成一系列短语。与提取式方法相比,生成式方法存在着未登录词、短语冗余和难训练等问题。近几年来,深度学习领域的研究在很大程度上推动了生成式关键短语的发展,但仍未有效地解决以上问题。因此在实际应用中,提取式方法仍占据着主导地位。当前主流的提取式方法主要是基于词图,该方法以词图为研究对象,计算词图中每个词语的重要性得分,最后依据词语重要性得分确定关键短语。本文对提取式关键短语进行了研究,主要从以下三个方面进行展开:(1)以TextRank算法为基础,利用LDA主题模型学习每个词语在特定文档下的主题分布,将该分布的信息熵作为随机游走过程中每个词语随机跳转获得的重要性值,提出了 EntropyRank算法。(2)以TextRank算法为基础,计算词语在单词级别和句子级别的相关性,将不同级别的相关性进行融合重构词图中两词语的连边边权,提出了 VSRank算法。(3)以Deep Graph Infomax(DGI)算法为基础,利用标题在整篇文档中的主导性,引入循环神经网络和注意力机制,以丰富文档的主题表示,提出了 T-DGI-KE(Title-enhanced Deep Graph Informax for Keyphrease extraction)算法。最后,本文在摘要、新闻和论文数据集上进行了实验,并对实验结果进行了定量分析与定性分析,验证了本文方法的有效性。
其他文献
在管道防腐中,阴极保护电位等运行参数的采集与分析一直是管道行业十分关注的问题。在管道企业日常电位测试中,测试极化电位的方法普遍较为繁琐,在实际使用中会消耗大量的人力、物力,导致目前川渝地区管道企业测试频率通常为一年一次,数据收集周期较长、利用率低,无法满足阴极保护评价需求。为提高管道阴极保护有效率,降低管道发生外腐蚀的风险,本文针对川渝地区管道阴极保护特征,采用理论分析与现场检测相结合的方法,通过
学位
随着天然气勘探力度的加大以及市场供应需求的提升,含硫天然气的开采已成为我国天然气开发的一个重要发展点。然而,由于硫化氢强烈的腐蚀性与剧毒性,在含硫天然气开采过程中一旦发生气体泄漏,将会危及人员的生命财产安全。为此,针对含硫气井开采气体泄漏问题,开展了含硫气井气体泄漏事故分析、气体泄漏途径分析以及气体泄漏原因分析,建立了气体泄漏故障树模型,并利用层次分析法实现了泄漏安全状况的定量评价,确定了气体泄漏
学位
作为一种新的计算和服务模式,云计算可以将海量的服务器资源和存储资源整合到资源池中,利用虚拟化技术极大的提高系统中硬件的利用率,并大幅简化了相关基础设施建设、优化资源以及加强信息安全。随着云计算与虚拟化技术的高速发展,公司和企业对于云计算平台方面的需求也在急剧增加,云桌面便是其中的产物之一。现阶段的云桌面技术主要融合了云计算、虚拟化、服务管理等多项核心技术。由于云桌面平台可以使员工的工作不受时间与地
学位
为了清除天然气管道中沉积的污物,保持较高的天然气输送效率,清管作业在油田现场是一项不可或缺的工作。清管过程中,收发球过程都具有较高的危险性,收发球筒在内部流场和外部环境的作用下也容易遭到破坏,因此,有必要研究收球筒在运行过程中的流场分布和振动特性,为现场收球筒的结构设计和选型提供依据。本文的研究内容分为收球筒的流场特性研究和振动特性研究。一方面,通过建立收球筒的三维模型,利用Fluent软件模拟收
学位
天然气净化厂污水主要有锅炉排污水、酸性汽提净化水、污水处理场外排污水和循环水排污水。对这四种污水进行调查分析,其中酸性汽提净化水合格率偏低,pH值、氨氮、铁离子、硫化物合格率长期不达标,无法回用至循环水系统;污水处理场外排水合格后直接外排,外排水量大,浪费严重。为实现污水回收利用,减少循环水系统补水量,节约水资源,本文主要研究工作如下:(1)调研国内外污水处理技术现状,研究酸水汽提工艺和污水处理相
学位
注水是油田开发中保持地层压力和提高采收率的一种重要的开发方式。但在注水过程中,注水储层存在不同程度的结垢问题,严重影响油田的正常生产。因此对注水储层的结垢机理及阻垢效果的研究具有重要的意义。本文在调研注水过程中无机垢的结垢机理及阻垢剂的阻垢机理大量文献调研的基础上,对QX油田注水储层的结垢机理与阻垢效果开展了理论与实验研究。对QX油田注入水与3 口注水井(Q2-71井、Q2-21井、Q2-42井)
学位
HZL油田自2014年10月投产以来,开发中陆续面临很多问题:(1)ODP实施后,主力油藏L层含油面积变大,储量规模大幅度增加。L层储层厚度较薄(厚度6.8m-12.3m),储层空间非均质性很强(渗透率范围118-746×10-3μm2),储层展布和岩性边界存在不确定性,需通过评价井扩边探明。(2)生产动态上表现出油藏天然能量不足、地层压力下降快(目前单井的平均地层压力下降约9MPa)、产量递减明
学位
《民法典》第580条第2款规定了合同僵局中的司法解除,然而关于司法解除的适用条件存在争议,未能形成统一意见。在适用范围的问题上,适用《民法典》第580条第2款应先判断合同是否为商事合同,并将民事合同排除出适用范围。在规范要件的问题上,应当结合当事人的申请、合同无法履行、以及解除合同相当事由等要素判断是否应当解除合同。
期刊
渤海J油田为一复杂断块油田,但油田现场忽略了各区块地质油藏特征、不同开发阶段储层伤害类型的差异,使用单一修井液体系,难以满足油田储层保护需求,大部分油井修井作业后普遍表现出产能恢复率低、恢复周期长等问题。因此,评价不同井区、不同开发阶段修井过程中的伤害类型,研发有针对性的低伤害修井液体系,对于油田的持续稳产具有重要意义。本文通过铸体薄片、XRD等岩心分析技术评价了 J油田主力储层孔隙结构特征和矿物
学位
现阶段,市场环境多元,市场前景广阔但却变化多端,致使现代企业之间的竞争愈加激烈,机会与挑战并存,既迎来机遇,又面临挑战,且随着社会的发展变化,传统财务管理模式与社会发展不匹配,无法满足企业管理的需要,倒逼企业发展,需要企业探索新的模式,开辟新的管理道路,提升管理能力与水平。在此大背景下,精细化管理受到关注与重视,是企业发展的主要手段,在业财融合下,许多企业都推出了精细化财务管理举措,迎合市场大背景
期刊