多实体间关联搜索与模式挖掘方法研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:tklsd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图目前已被新兴应用广泛用于表示信息,例如谷歌的知识图谱以及基于资源描述框架(Resource Description Framework,RDF)的语义网应用。图结构数据在这些领域里用于描述实体的属性和实体间的关系。特别地,实体以及它们间的二元关系构成了实体关系图。实体之间不仅显式地通过代表关系的弧直接相连,还隐式地通过间接的路径或者子图相连。搜索多个实体之间的关联关系是很多领域中的一种常见信息需求。然而当图的数据规模变大之后,搜索实体间的关联将变得非常具有挑战性。一方面搜索的空间十分巨大,使得搜索本身十分有难度。另一方面,关联搜索的结果数目也十分之多,使得用户在理解和探索这些关联结果时充满困难。本文针对这些问题的解决方案进行了探索。特别地,在大规模图结构表示实体间关系的语义数据上(如知识图谱)进行深入研究。语义关联在这种场景下被定义为连接查询实体的极小连通子图。区别于传统检索高排名结果的方法,本文致力于显式的搜索所有的语义关联并挖掘它们的公共概念模式来组织、摘要结果。以便促进对关联关系结果的理解和探索。具体而言,本文主要有三方面的贡献:1.提出了一个基于距离剪枝的关联搜索算法。该关联搜索算法不仅可以用于传统的两个实体间的关联搜索,还可以应用于多个实体的场景。同时为了在搜索到的语义关联中去除重复,本文定义了语义关联标准码,并提出一种可以在搜索和挖掘中广泛使用的全序关系。2.提出了基于骨架划分的模式挖掘算法来摘要搜索到的语义关联。该算法同时利用语义关联的图结构和标签(即骨架)使得划分的语义关联块更加细粒度,因此可以高效的剪枝掉不可能频繁的语义关联模式。3.进行了较为丰富的实验来评估以上算法。使用了在不同维度充满多样性的真实世界中的大规模图来实验提出的语义关联搜索算法和语义关联模式挖掘算法。在不同参数设置下观察算法效率。
其他文献
随着计算能力的提升,以及神经网络的发展,越来越多的学者投身于生成式模型的研究。生成式对抗网络,通常可以简称为GAN,是一种在当前十分流行的生成式模型。自最原始版本的生
17世纪开始,底特律从一个殖民定居点逐步发展起来。19世纪,依托大湖区便利的交通条件和丰富的矿产资源,底特律从一个小城市逐步发展成为美国重要的工业城市,并在20世界初,依
豉香型白酒的传统工艺饼曲是一种具有代表性的小曲种类,曲的品质能够影响酒的质量和出酒率,曲中的不挥发性化合物能够决定微生物的生长,同时也是重要的风味前体物质,但小曲中
液力透平是一种利用液体的动能及压能做功的多级涡轮式流体原动机,特别适用于工业流体(液体)高压能的回收利用,利用液体的高余压产生旋转动力,带动发电机发电,或带动水泵、风
发动机内部燃烧流动过程极其复杂,机理仍未明晰,现有的燃烧诊断技术无法实现对湍流燃烧过程的瞬时三维测量。火焰的化学发光能够实时反映燃烧状态与火焰的结构信息,计算断层
本文针对现有承力框架熔模精密铸造成形存在的缩松铸造缺陷严重问题,采用Procast计算机数值模拟软件并基于现有产品缺陷情况,预测熔模精密铸造成形承力框架缩松缺陷的产生,通
近年来,随着智能监控系统的广泛应用以及计算机视觉技术的不断发展,群组行为识别已经成为智能视频监控领域中的关键技术,对于公共安全、人机交互和视频分析等领域具有重要的
随着智能网联汽车和移动通信的发展,车辆通信和车联网在生产和生活中越来越普遍,信息安全是重中之重。然而,窃听设备的计算能力不断提升、通信设备的数量不断增加,传统的加密
无刷直流电机体积较小、质量较轻,且运行时噪声较小,可靠性较高,因此其常被应用于机器人的相关研究。本课题针对仿人机器人关节用电机,设计了一台无刷直流电机,采用改进差分
精密微结构功能表面的金刚石超精密加工技术是近年来国内外兴起的一项新技术,被广泛应用于工业制造、航空航天等领域。这项技术在国内兴起时间较短,而且加工设备的落后极大的