不确定图上Top-k子图相似性查询技术研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:jxnydxlhy1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着图结构在生物信息网络和社交网络等领域的广泛应用以及各种外界因素对数据获取的干扰,不确定图模型越来越受到研究者的关注。同时,子图的相似性查询作为图上的基本查询之一广泛应用于各种问题中,研究者们设计并实现了大量的算法来处理查询图为给定的确定图的子图相似性查询,然而对于查询图是不确定图和查询结果为Top-k的情况并没有给予足够的重视且遇到了很大的挑战。针对上述问题,本文对不确定图上的Top-k子图相似性查询问题进行研究。首先,本文考虑边之间的存在概率相互独立的不确定图为数据图的情况,由于查询图为数据图中的一个导出子图,故查询图也为边之间的存在概率相互独立的不确定图,然后本文形式化定义了面向不确定图上的Top-k子图相似性查询问题,并针对此问题提出了基于可能世界模型的算法。本文中提出了一些优化算法以进一步提高算法的执行效率,例如根据边之间概率的关系及所求匹配结果的结构特征实现索引优化以减小索引集大小;基于聚簇分块技术对数据图进行预处理以尽量缩小子图匹配范围;根据各个匹配边的概率与编辑距离之间的关系改进计算模型从而避免枚举所有可能世界图来计算概率;根据Top-k的要求提出了基于阈值和Bound剪枝的匹配处理过程等。最后通过大量实验验证所提及的算法及优化算法的有效性。此外,本文考虑边之间的存在概率具有相关性的不确定图为数据图,查询图同数据图类型相同且为其导出子图的情况。该问题是上述问题的改进,定义了带有相关性的不确定图上Top-k子图相似性查询问题。并在上一节的基础之上,结合本节中边之间的关系提出了新的索引建立方法,采用动态获得子结构的算法过程并结合概率上界实现优化剪枝。文中通过实验验证了所提到的算法和优化方法的有效性。总之,本文从越来越接近实际应用的不确定图模型的Top-k子图相似性查询的典型特征和挑战出发,针对不确定图和带有相关性的不确定图上子图相似性查询的关键技术展开研究,如基于动态匹配方式等,并提供了有效的基于不确定图上的Top-k子图查询问题的处理方法。本文的研究工作所采取的算法思想和剪枝策略为相关课题的开展铺平了道路。
其他文献
数字水印是网络与信息安全方向的一个重要分支,在数字化媒体的信息安全与版权保护方面有着极为重要的应用。目前的研究重点是构造有强鲁棒性的稳健的数字水印算法,这是本文的研
在人们日常的办公过程中,常常需要使用文本编辑器进行文本搜索工作,例如在一篇文档中找出所有来自某一公司Email地址,或者找出所有特定范围内的电话号码等。显然要完成上述功
随着虚拟现实以及三维交互应用技术的不断发展,大型模型的实时显示逐渐成为计算机图形学研究的热点。作为虚拟场景交互式漫游的主要加速方法,遮挡剔除技术日益被众多科学家所
随着三维计算机动画电影成为一种现代的娱乐方式。对于动画电影中人物表情的要求也随之提高,如何做到逼真生动,符合人们日常的认知审美要求,是动画导演所要解决的一个重要问
IT系统在企业、部门的信息管理中得到了越来越广泛的应用,随着IT应用的扩展,IT网管系统对告警管理的智能化要求越来越迫切。在IT系统中,如果某个节点或节点中的某个网元发生故障
M矩阵是一类具有非正非对角元和非负对角元的矩阵,逆M矩阵是一类逆为M矩阵的非负矩阵。逆M矩阵在许多领域中都具有广泛的应用。本文利用图论理论研究逆M矩阵的完备问题,根据
OFDM技术以其有效对抗多径衰落、频谱利用率较高的优点,成为未来宽带无线通信系统的关键技术。OFDM系统中的自适应调制技术,通过为各个子信道选择合适的调制方式和信号功率,能够
随着信息时代的到来,科学实验、企业运作等诸多领域正不断地产生越来越多的数据,如何经济地存储、高效地处理这些海量数据已成为一个数据库应用中迫切需要解决的问题,具有重大的
网格计算是一种利用互联网,把广泛分布的各种计算资源互联在一起的新型技术。传统因特网实现了计算机硬件的连通,万维网实现了网页的连通,而网格则试图实现互联网上所有资源的全
移动自组网是一种有特殊用途的对等式网络,具有无中心、自组织、可快速展开及可移动等特点。匿名安全问题在移动自组网中受到越来越多的关注,目前已成为研究热点之一,本文主要分