面向大规模图数据的紧密子图查询处理关键技术研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:sellene
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据技术的飞速发展,大规模图数据在各个领域中的关键作用逐渐凸显出来。如何在不同类型的图中找出有用的结构从而获取有效信息成为一个受到广泛关注的问题。作为由图中一组内部紧密联系的顶点组成的拓扑结构,紧密子图由于其直观、易于解释、扩展性强等特性逐渐成为图数据管理与挖掘中的研究热点,被广泛应用于社交、生物、物理化学、金融等各个领域之中。当前,各种类型的紧密子图得到了学术界和工业界的研究。然而随着数据规模和类型的增加,紧密子图搜索面临着算法效率下降以及难以满足新型应用需求的问题。为了满足大数据环境下不同应用的需求,提升查询效率从而优化用户的体验,本文着重选取了三种最为常见的图:简单图、不确定图和二部图,并分别对不同类型大规模图中的子图搜索问题展开了深入的研究,包括:简单图和不确定图上的基于影响力社区模型的紧密子图搜索问题以及二部图中基于最大准二部团模型的紧密子图搜索问题。在参阅了大量的现有工作后,我们针对现有子图模型的不足,结合不同图的属性和结构特征,提出新颖的子图模型以及高效的子图查询算法。本文的主要工作和创新点如下:(1)简单图影响力社区搜索。在简单图中,首先针对现有影响力社区搜索中由于顶点权重不同影响结果正确性从而限制其应用场景的问题,提出了一种能够处理相同权重顶点的更通用的影响力社区搜索方法。对于可能影响最终结果的具有相同权重的顶点,通过顶点之间的连通性判断来避免对结果产生影响。同时,为了进一步提高算法的效率,提出了一种基于Union-Find的方法来快速地判断顶点之间的连通性。最后在大规模的真实数据集上对所提出的方法和现有的方法进行了大量的实验和对比。实验结果表明,该方法能够有效地处理权重相同的顶点从而保证获得的影响力社区的准确性。(2)不确定图影响力社区搜索。在不确定图中,首次根据边的不确定性提出了一种新型的社区模型用于有效描述不确定图影响力社区。对于不确定图影响力社区的计算,首先提出了一种基于顶点剥离的影响力社区在线算法,该算法通过迭代地删除图中权重最小的顶点并更新被删除顶点的邻居信息来获取影响力社区。为了提升查询的效率,提出了一种新型的基于表的索引以及索引查询方法,并将索引组织成树状结构来提升其查询的效率。同时,为了减小索引的空间占用,进一步提出了两种优化方法:社区合并和社区压缩,前者可以合并索引中不同节点间重复存储的社区,而后者可以压缩同一个节点内存储的社区顶点。最后在大规模真实数据集上的实验对比了不确定图与简单图中影响力社区模型的差异并评估了不确定图影响力社区搜索算法的效率。实验结果表明,基于索引的方法比在线方法运行效率提升了多达两个数量级。(3)二部图准二部团搜索。在二部图中,研究了一种准二部团模型最大k-biplex的搜索问题。首先证明了该问题为一个NP-hard问题,并提出了一个解决该问题的MBS算法。该算法通过回溯的方式枚举所有可能的极大k-biplex作为候选集合,然后在其中挑选规模最大的k-biplex作为输出。在枚举候选集合时,提出了两种基于k-biplex特性的剪枝策略来去除不可能成为k-biplex的候选集合,从而提升搜索的效率。为了进一步缩短搜索时间,提出了一种基于core的图约简方法。该方法能够将图约简为一系列规模较小且可能包含最大k-biplex的子图。同时通过研究子图中可能包含k-biplex规模的上下界对不包含最大k-biplex的子图进行剪枝,从而进一步提升算法效率。此外还提出了启发式算法及并行算法来进一步满足实际需求中对效率的要求。大规模真实数据集上的实验结果显示,所提出方法的计算速度在现有最先进方法基础上提升了2到3个数量级。
其他文献
研究了技术法务对六大医疗器械创新主体“政、产、资、用、学、研”,以及对医疗器械创新大赛赛程设计和评价规则的作用,提出了相关转化策略,供医疗器械改进、设计、研发、投资转化、评价、成果管理工作参考。
期刊
期刊
家庭医生签约服务是强化基层医疗卫生服务网络功能,合理分配卫生资源,实现卫生服务由治疗向健康管理方向转变的重要途径。本文对实践中遇到的问题和困难进行概述和浅析,并从优化服务政策、健全服务制度、增强服务意识、细化服务考核、明确服务目标、明晰服务责权、创新服务方式、提升服务能力、提高服务质量、扩大服务宣传、稳定服务关系、完善服务保障等多方面进行思考,提出建议,以期探索出适合中国特色的家庭医生签约服务模式
期刊
目的:慢性阻塞性肺疾病(Chronic Obstructive Pulmonary Disease,COPD)简称慢阻肺,是以呼吸系统症状为主要表现的慢性疾病,感染可导致其急性加重,甚至出现呼吸衰竭进一步导致死亡。据世界卫生组织报道,慢阻肺已成为全球第三大死因。随着吸烟人数增加、人口老龄化加剧等因素,慢阻肺的患病率和住院率升高,这给社会经济和公共卫生资源带来巨大负担。慢阻肺的诊断主要依靠患者的临床
学位
目的:分析国家医疗器械抽检质量安全风险管控方式,提出完善建议,以达到更加严密控制风险,保障公众用械安全,促进行业健康发展的目的。方法:梳理美国、欧盟、日本的医疗器械监管政策,并与我国医疗器械监管政策进行对比,归纳国家医疗器械抽检质量安全风险管控手段。结果与结论:美欧日均未明确提出医疗器械抽检的概念及实施手段,且其实行的医疗器械检查、检验、结果评估、召回等措施的全面性和针对性不及我国医疗器械抽检政策
期刊
期刊
公元7世纪末8世纪初,日本前后两代都城藤原京、平城京的营建过程完成了从复都制到单都制、从中央宫阙型都城到北阙型都城的双重转变。本文在综合日、唐两方史料及近年考古发掘成果的基础上,对藤原京、平城京的都城形制变化与律令国家的政治体制、历次日本遣唐使入唐后情报获取的具体关联加以重新审视,以期能够对理解同期东亚国际秩序背景下日本都城制度的演变特征有所裨益。
期刊
航空航天工程的水平体现一个国家的科学技术水平,也是国家综合国力的体现。为促进航空航天事业发展,航空航天的人才培养显得尤为重要。北京航空航天大学、美国麻省理工大学和英国帝国理工大学高质量的航空航天学科本科教育得益于构建一套系统的航空航天人才培养体系,包含培养目标、专业教育能力要求、课程体系和教学模式等。通过中、美、英三国航空航天学科的人才培养模式对比分析,为我国航空航天人才培养模式的完善和创新提供一
期刊
天津市滨海新区地处华北平原东北部,软土覆盖层厚,在地震作用下,产生的震害要比基岩和硬土场地严重得多。天津是地震频发区,历史上曾多次遭受6级以上地震波及,因此研究滨海新区场地类别分区具有重要现实意义。文章通过滨海新区及周边地区地震工程地质标准钻孔和工程地质等基础资料的收集整理,并辅以地震工程地质标准钻孔补充勘察,按照《场地地震工程地质条件调查》中的方法,给出了天津市滨海新区的场地类别分区结果,增进了
期刊
采用ASTM G36腐蚀试验和力学、金相等测试方法,对热丝TIG堆焊Inconel 601进行了焊接工艺的研究,对堆焊层各项性能进行了研究。研究表明热丝TIG是堆焊Inconel 601镍基合金的有效方法,堆焊层平整度较好,金相组织未观察到粗大晶粒;堆焊层力学及硬度均符合相关要求,同时也满足在Cl-应力腐蚀环境中使用。
期刊