不确定图上的近邻查询与近邻模式挖掘算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:ZPHZPH
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图数据的不确定性普遍存在,研究不确定图上的高效查询处理与模式挖掘方法具有重要意义。本文研究的不确定图是指边上附带存在概率的不确定图。现有的不确定图上的查询和挖掘工作都是基于精确结构的,如子图匹配查询,子图模式挖掘等。然而实际应用存在两个问题:1.用户对于查询结果的结构要求并没有那么严格。2.图中许多重要的模式不一定都以同样的连接结构存在。针对问题1,本文提出一种新型查询——近邻查询。给定一个查询标签集R和距离约束ζ,在不确定图G上进行近邻查询就是要找到标签集包含R并且任意两个顶点间距离不超过ζ的匹配顶点子集。为解决该问题,本文提出“可靠期望距离”,并基于可靠期望距离建立高效的近邻关系图索引,从而将不确定图上的近邻查询转化为近邻关系图上的团查询问题。最后使用树搜索算法解决近邻关系图上的团查询问题,其中一种两阶段预处理算法可以有效的降低搜索空间,分支界限方法可以进一步提高检索效率。针对问题2,本文提出了不确定图上的近邻模式挖掘问题。近邻模式是一个由顶点标签构成的集合,这些标签在图中联系紧密且频繁。给定一个不确定图G和支持度阈值min_sup,近邻模式挖掘就是找出G中所有支持度超过min_sup的标签集合。本文基于可靠期望距离定义了不确定图近邻模式的支持度,并基于和近邻关系图索引提出了提出“近邻模式覆盖树”概念,提出两种高效的剪枝策略来得到所有近邻模式。基于真实数据和合成数据的实验表明本文提出的近邻查询处理和近邻模式挖掘算法具有有效性和高效性。
其他文献
视觉信息的复杂性使得图像处理比较耗时,从而使得基于图像内容的搜索系统后台数据更新较慢,同时为了缩短用户的前台响应时间,传统的图像检索系统不得不选取速度快但效果并非最佳
药理学、神经生理学和毒理学等领域常采用实验鼠自发活动实验进行研究工作,实验鼠自发活动属于动物行为学研究的内容。动物行为学的早期研究,主要通过人为观察和记录实现对动
信息化产业技术的飞速发展极大的改变了人们获取利用信息的方式,人们越来越多的是通过电子文件进行传播信息。针对煤炭这一特定领域而言,各类电子煤质文件呈爆炸式增长。面对
随着监控系统的普遍应用,如何有效地对不明身份的人进行身份识别已经成为所有人关心的话题。步态识别,即根据人行走时的姿态进行身份识别,因具有远距离、非侵犯、难以模仿和
三维数字化牙齿模型是计算机辅助口腔正畸系统的基础。在计算机辅助口腔正畸的过程中使用三维数字化牙齿模型不仅可以随时观测牙齿模型记录正畸治疗进展中的数据,同时也易于
仿真系统中的智能体决策过程是人工智能领域的一个重要的问题,人工智能领域的很多研究成果都可以应用于不同的仿真系统的智能体控制中,并得到良好的效果。但同时,不同的仿真
当今互联网上信息繁杂,存在多种多样的信息格式,质量参差不齐。其中结构化数据是众多种类的数据中质量最高的一类,它包括关系数据库、本体、XML数据库等。互联网上已有的结构
在面向对象的软件设计中,类内部、类与对象、类与类之间和类与外部系统之间的耦合成为软件开发中的瓶颈,严重影响到软件的可维护性、健壮性、重用性。为了提高软件的复用性、保
近年来随着互联网用户的不断增加,用户产生的信息呈现出指数级的增长,这些信息中的很大一部分都是以数字图像的形式存储的,面对海量的图像数据,在充分识别图像的基础上既要对
软件复用技术是克服“软件危机”,从根本上提高软件生产率和质量的一种比较有效的对策和方法,而基于构件的软件复用是目前软件设计和代码复用的成熟和主流技术。随着软件应用