领域实体消歧与事件填补系统的研究与实现

来源 :辽宁大学 | 被引量 : 0次 | 上传用户:miyinghua
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的飞速发展以及互联网的普及应用,网络数据正以指数级的速度增长,网络已经成为最大的数据仓库之一,且大量的数据在网络上以自然语言的形式呈现。然而此类数据的质量参差不齐,良好的数据治理技术可有效提高数据质量。将自然语言中含有事件信息的半结构化、非结构化文本以结构化的形式呈现出来,即识别特定类型的事件,并将事件主体及相关论元提取出来,将为自动文摘、自动问答、信息检索、辅助决策等应用提供有力支撑。但是抽取后的事件主体及部分论元具有高度的歧义性和多样性,歧义性体现在相同的实体指称在不同的上下文中可以指不同的实体,而多样性是指同一实体在文本中会有不同的指称。如果能够消除上述歧义,将事件信息与现有数据资源连接起来,实现对现有资源的重要补充,将更有助于人们做出决策,从而有效利用网络数据进行数据分析。特定领域的数据往往存在特定数据特征,本文以金融领域为例,针对数据治理中的实体消歧和事件填补技术进行研究,设计并实现了融合多特征图及实体影响力的领域实体消歧与事件填补系统,实现将高质量数据以结构化形式展现给用户。本系统由基于候选实体的多特征图构建模块、领域实体消歧模块和领域事件填补模块三部分组成。在基于候选实体的多特征图构建模块中,首先提取CN-Dbpedia中金融类别相关关键词三元组,构建金融领域知识库;然后针对金融活动类文本,提取待消歧实体指称,融合字符串及语义的相似特征,筛选出候选实体;利用知识库三元组信息获取候选实体间2-hop内的关系,同时计算候选实体间相似度作为边权值,进而将多特征信息充分融合到图模型当中,完成多特征图构建。在领域实体消歧模块中,针对现有方法存在仅实现单实体指称消歧、忽略了实体影响力及候选实体间相似度对消歧结果的影响以及冗余图节点增加图计算复杂性等问题,提出了一种融合多特征图及实体影响力的领域实体消歧方法,采用动态决策策略,利用改进Page Rank算法,并结合实体影响力计算多特征图中候选实体的综合评分,进而获得可信度较高的消歧结果。测试结果验证了提出方法在特定领域实体消歧的精确度及效率。事件填补模块中,针对股权增持、破产清算等12类金融事件,设计单事件要素消歧的事件填补及多事件要素消歧的事件填补两种存储策略,实现新事件填补及关联表相关属性的更新。为实现上述系统,本文首先对研究背景及研究现状进行了阐述;然后依据需求及相关技术对系统进行了总体分析与设计,针对其中的领域实体消歧关键问题,论文展开研究并给出了解决方案,并根据评估标准对提出算法的有效性进行了实验与分析。最后,论文对该系统进行了相关测试,证明了系统的可用性及有效性。
其他文献
公共关系管理作为现代企业的一项重要管理职能,是现代企业战略的关键组成部分,在企业内外交流中逐渐凸显出其不可替代的作用,同时也是促进现代企业不断壮大发展、提升知名度和影响力,化解外部危机及处理舆论影响的有效因素。公共关系管理涉及各方面事项,需要各职能单位有效协同配合围绕既定目标开展一系列具体的活动和工作。积极主动地协调好、运行好,发挥好公共关系管理职能作用,更好的应用于实践,有效的开展“政—企—地”
在联合作战行动背景下,信息作战的主要任务是"破网断链"。准确、科学、直观地描述电子目标态势信息,加强电子目标图谱可视化研究能够增强意图研判、威胁分析、能力评估等战场态势智能感知能力。在进行本体构建、关联关系及应用显示等方面的需求论证后,探索出经过本体建模后将得到的数据信息与关联规则用图谱节点表示出来,同时标明节点之间的关联关系,最终实现电子目标图谱的可视化。
学位
通信干扰决策是认知电子战相关研究中的一个关键技术难点。在复杂电磁环境下,传统通信干扰决策算法在针对敌方未知工作状态时,存在算法收敛慢,干扰效果差等问题,无法满足现代认知电子战对灵活性和实时性的需求。为了弥补传统通信干扰决策算法的不足之处,本文基于知识驱动的思想,对潜藏在通信干扰历史数据中的知识进行挖掘和建模,并设计了基于知识的通信干扰决策算法。本文的工作内容与创新点如下:(1)针对“点对点”通信场
传统上,无线通信波形设计主要依赖于专家掌握的波形知识与经验。然而,随着应用环境与需求日益复杂多样,积累的波形知识不断丰富,基于设计者知识储备和经验进行人工波形设计的方法不仅效率低下,而且难以保证选所设计波形的优化性。因此,有必要通过对现有通信波形知识进行结构化表征、存储和利用,提高波形设计的自动化与智能化水平。近年来兴起的知识图谱(Knowledge Graph,KG)技术能够构建结构化知识库,表
随着科学技术的进步,互联网技术在社会中应用的范围越来越广泛,电子商务企业也获得了非常迅速的发展。然而,随着互联网的普及,电子商务企业越来越多,电子商务企业之间的竞争也越来越激烈。电子商务企业想要在激烈的市场竞争环境中获得更好的发展就需要强化内部管理,加强成本控制,通过提高内部管理水平来提升企业的市场竞争能力。成本控制作为企业内部管理的重要组成部分,对于企业的发展具有重大的现实意义。本文对电子商务企
盲盒作为一种新兴的消费模式在短期内风靡中国,其背后的心理机制和影响因素值得探究。本文从社会支持和情感消费动机入手,采用问卷方式进行调查,发现了消费者会出于娱乐、情感补偿和眷恋童年的动机更多地购买盲盒;社会支持由于与盲盒消费之间存在替代关系,会削弱由情感补偿动机引发的盲盒消费需求;消费者的社会支持越多,会越受到其背后的社群网络影响,产生更多的盲盒消费行为。
当今时代,互联网+博物馆概念火热,各博物馆依托大数据及云计算等先进技术,建设各具特色的智慧博物馆。随着新媒体时代的到来,新媒体传播、专题APP、轻应用、小程序等功能丰富的移动互联推送及推广方式愈加主流,曾经作为博物馆数字化第一步的博物馆门户网站的作用逐步降低。本文通过分析新媒体时代博物馆文化传播现状及新媒体时代网络传播现状,尝试从完善发展传统网站传播方式、配合新媒体传播形式、发挥博物馆门户网站优势
液压与气动技术授课过程中存在学生学习积极性不高、难以理解并掌握重点知识、学用脱节等难题。因此,本文以传统的液压与气动技术教学模式为参考对象,提出基于OBE理念的液压与气动技术教学模式的课程改革方法,以此激发学生的学习兴趣,在调动学生的学习积极性的同时,注重知识运用能力的培养,达到为社会培养懂液压会液压的技能型人才的目标。
学位