基于k核的紧密子图查询算法研究

来源 :上海海洋大学 | 被引量 : 0次 | 上传用户:uj_mosquito12
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
紧密子图查询作为图查询的研究热点之一,在很多领域都有着重要的应用。现有的研究中已有许多紧密子图查询方法,如基于模块度优化的算法、谱方法、非负矩阵分解等。对于紧密子图的定义也有多种,常见的有k架(k-truss)、k团(k-clique)、k核(k-core)等。其中k核的定义要求图中每个节点至少有k个邻接节点,即每个节点的度至少为k。根据该定义,k核可以在线性时间复杂度内计算得到,具有较好的应用基础,已在许多方面有所研究与应用。由于k核只考虑图中节点和边的关系,据此得到的仅是一个边稠密的子图。但在很多场景下的图数据还会包括更多其它属性,若在查询紧密子图时不考虑这些属性则所得到的结果缺乏实际意义。在现有的k核研究中,已有部分文献开始结合图中的其它属性,如:图的关键词属性、图的空间位置属性、图的节点影响力属性等。但目前对于k核紧密子图的查询中,结合图中边权值的研究还较少,而在很多场景下,图中边的权值往往具有很强的语义关系。考虑到这一点,本文提出了一个新的紧密k核子图查询问题。目前对于紧密子图的查询,主要有两个研究方向:社团搜索和社团检测。本文所提出的问题属于紧密子图查询中的社团检测问题,其查询得到所有符合要求的连通子图。并且,本文考虑到查询最紧密子图往往会消耗较多的时间,在一些应用场景下也并不需要查询子图权重的最值。为此,本文所提的问题不局限于社团检测中最值的查询,子图只需满足给定的节点平均权值即可,而该值可以根据实际应用需求给出,具有更高的灵活性,能适应更多的查询场景。本文主要完成的工作如下:(1)提出了在加权图中查询联系紧密的连通k核子图问题,简记为紧密k核子图查询(Query Closely Relatedk-Core Subgraph,QCRKS)问题,其描述如下:给定核值k、节点平均权值,在加权图中查询紧密连通k核子图,该子图节点平均权值大于等于。随后通过多项式规约的方法,证明了QCRKS问题是一个NP-难问题。(2)由于无法为QCRKS问题找到一个在多项式时间复杂度内的最优算法,故本文为该问题设计了启发式算法CRK-G,其先在原图中查询一个最大连通k核作为候选子图,然后采用贪心策略通过在候选子图中不断迭代删除权值最小的节点,从而得到满足条件的紧密k核子图。(3)为提高CRK-G算法的效率,本文在其基础上进行改进,设计了CRK-C和CRK-F算法。CRK-C算法使用图压缩策略,在迭代之前先将权值相近节点进行合并,从而降低候选子图的规模。CRK-F算法使用单次多节点删除策略,每次迭代从候选子图中删除多个节点,从而减少迭代次数。两个算法分别从降低图规模和减少迭代次数两个方面出发,提高了查询效率,其查询速度明显高于CRK-G算法。(4)通过在真实数据集上的实验,对比了3种算法在不同查询场景下的查询效率,验证了算法的误差,分析了图压缩算法的有效性,以及最后通过与传统k核方法的对比和一个实例分析验证了本文所提模型的有效性。
其他文献
腹泻是影响畜禽发育和生长的多发病,它制约着养殖业的发展。我国的中药资源非常丰富,在抗病原微生物的同时,又能改善肠道菌群,并且提高机体免疫力,在畜禽腹泻的防治上具有独特的优势。该文在分析畜禽腹泻病因的基础上,针对细菌性腹泻、病毒性性腹泻、寄生虫性腹泻以及非感染性腹泻等不同情况常使用的抗腹泻中药,结合防治机制对中药防治畜禽腹泻的研究现状进行了全面的阐述,以期为后期的研发提供理论依据。
期刊
<正>在新课标的背景下,小学英语教师就要注重提高教学效果,改善作业质量,减轻学生在英语学习中的压力,对课堂教学内容进行深入的研究,掌握学生的真正学习状态,开展小学英语单元整体作业设计,促进发展学生的核心素养。优化评价方式,才能将学生的小学英语学习效果提升上来。在开展教学的过程中,
期刊
<正>我国的能源结构丰富而复杂,其中电力能源为重要的组成部分之一,多年来一直持续不断地支持着我国的现代化建设。但随着我国经济的飞速发展,电力能源有限性和不可再生性的弊端开始显露,我国的生态环境保护也在发展中受到了阻碍。于是新时期以来我国党和政府大力推行可持续发展战略,号召各大企业节能减排,合理规划能源资源利用,同时大力扶持新能源的开发和推广,
期刊
海面温度(Sea Surface Temperature,SST)与全球气候变化、海洋灾害、海洋生态系统密切相关,因此准确的预测海面温度是一个具有重要意义的课题。随着海洋监测技术的不断进步,海面温度等海洋环境要素数据被大量采集,数据驱动的海面温度时间序列预测方法逐渐显现出了其良好的效果。但现有的数据驱动方法忽略了海面温度与气温、风速等其它海洋环境要素之间的关联关系,限制了精度的提高。为了有效捕获不
学位
在生物学研究领域,高通量测序技术催生了海量的生物学数据。从这些生物学数据出发,利用合适的生物信息学方法发掘与疾病发生机制相关的生物通路,研究疾病与生物通路间的关系,对疾病的诊断和治疗技术的发展具有重要的意义。从高通量的海量数据中获得对疾病深层次的认识,发现疾病的复杂机制依然是研究人员面临的一个挑战。虽然在过去的十几年,相关研究人员已经开发出一些基因富集分析方法来发现与疾病相关的生物通路。然而这些方
学位
车辆分群调度问题是计算机科学和运筹学中一类重要的组合优化问题,其在现实生活中具有广泛应用,如磁盘碎片整理、程序重构、细胞检测、集成电路测试、考试时间表安排等等。因此,对其进行研究具有重要的理论与实际价值。本文主要研究几个特殊网络上单台车辆分群调度问题。给定一个网络图,若干个待服务的客户分布在该网络上,并且这些客户被划分为若干个子集,每个子集称为一个群。给定一台车辆,其需要服务所有客户,且每个群内的
学位
随着互联网和社会经济的迅速发展,人们面临的法律问题越来越多样化、复杂化,因此法律咨询业务的推进对社会的发展而言,有着非常重要的价值。然而,律师相关的咨询业务在现实开展过程中还是面临各种各样的窘境,比如:发展速度慢,律师咨询业务创收较低,聘请率低下,律师业务水平不足等诸多问题。因此,借助大数据和深度学习的方法,建立自动化民事纠纷问答模型具有较高的学术价值与应用价值。民事纠纷问答面临的难点为专业领域性
学位
近年来,随着人们对海参、海胆、贝类等海珍品需求量的增加,海产养殖业取得蓬勃的发展。在海洋牧场建设领域,主要利用拉网或人工抓取的方式对水下环境中的海珍品进行捕捞,但上述方式存在劳动强度高、工作效率低及安全风险高等问题,因此研发一种能够自动识别、定位及抓取海珍品的水下机器人,对降低劳动强度、提高捕捞效率以及促进海洋牧场的智能化发展具有重大的意义。水下目标的精确检测是水下机器人实现自动化检测和抓取作业的
学位
水产养殖业在我国农业经济社会发展中占有重要地位,水产养殖规模和产量也在逐年扩大。在目前的水产品交易中,数据多采用中心化的存储方式。在这种模式下,数据容易被篡改、共享能力低且追溯困难。当出现水产品质量安全问题时,无法根据订单信息进行水产品养殖信息的有效追溯。除此之外,交易数据对于养殖厂的经济效益和整个水产品供应链的良性运转也有着重要作用。区块链技术具有去中心化、数据公开透明、不可篡改和信息可追溯的特
学位
近年来,随着我国水产养殖业的飞速发展,精细智能以及预防化养殖方式已逐渐成为未来的养殖趋势。作为水产养殖品种之一,在水产养殖过程中出现的例如温度急剧变化、溶氧异常或人为干预等多维因素让虾苗处于应激状态,影响虾苗存活率。及时发现虾苗处于应激状态可以大幅减少养殖损失,提高虾养殖产量和效率。一般急性应激会使虾苗产生异常生理和行为变化,因此虾的行为对养殖者而言是一种有价值的参考信息。本文以南美白对虾为研究对
学位