大规模图中的紧密子图挖掘算法研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:xinzhichaoniao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图作为一种表示实体之间关联关系的数据结构被广泛应用于复杂系统、大规模集成电路和社交网络等领域的建模与分析。大规模的图一般呈现出全局稀疏但局部紧密的现象,这些紧密的局部结构代表了图的关键特征,在社区发现、病毒传播、广告推荐等领域有重要的应用价值。因此计算并挖掘图中的紧密区域,即紧密子图是非常有必要的。但是挖掘的紧密子图不仅要保证较高的内聚性,还要考虑计算上的高效性。挖掘紧密子图的需要选择合适的紧密子图指标以平衡子图的内聚性和计算效率,本文以k-truss和k-core两种紧密子图指标作为研究对象进行分析计算,这两个紧密子图指标可在接近线性和线性时间内计算且都能保证很好的内聚性。现实世界的图是不断增长和变化的,边和顶点都在不断的加入或删除,所以关于动态紧密子图的维护也是一项重要挑战。在本文中,通过应用图分析中的理论、技术和方法对紧密子图的挖掘进行系统的研究。针对多边动态图、全动态图、动态超图、流式超图中紧密子图挖掘和超图中的紧密子图模型设计等问题,本文进行深入研究,主要贡献归纳如下。1.本文研究多边动态图中的k-truss维护问题。维护k-truss是指在图动态变化后更新k-truss,但图在动态变化后通常只有少部分区域的k-truss是变化的,因此维护k-truss的关键是避免重新计算整个图以减少冗余计算。与现有的主要关注单条边动态的工作不同,本文提出了多条边同时插入或删除的k-truss维护的批处理算法。本文首先提出三角形不相关集的边集结构,这个边集的插入或删除可以使得k-truss最多改变1,解决批量处理中量化k-truss变化的难题;然后本文提出两个衡量k-truss变化的指标,能够极大减少算法搜索潜在变化边的范围。大量实验证明,与单边处理的方法相比,本文的批处理算法可以显著提高k-truss的维护效率,且动态边数越多时算法加速效果越明显。2.本文研究全动态图中的k-truss维护问题。全动态图的动态性更加复杂,包含了大量的动态边和动态顶点。具体来说,本文考虑批量动态边和顶点的k-truss维护问题,提出高效的算法,只需搜索图中小范围受影响的边就可以更新k-truss。同时,所提出的算法允许并行实现,以进一步提高k-truss的维护效率。大量实验证明本文算法的高效性和可扩展性。3.本文研究大规模动态超图中的k-core维护问题。超图中的超边包含任意数量的顶点,而不是像普通图中的边只包含两个顶点,超图可以在复杂的关联关系应用中代表多元的互动关系。然而,在超图动态变化时,由于超边的指数级数量会使得重新计算k-core产生难以承受的成本。本文提出一种高效的精确k-core维护方法,与重新计算的分解方法相比,能够显著减少计算k-core的时间。所提出的算法可以精确地指出需要更新的k-core的子图区域。本文还提出一个辅助索引结构,可以加速k-core维护算法的搜索过程。大量实验证明本文的算法的高效性。4.本文研究流式超图中的k-core维护批量处理问题。与现有的工作不同的是,本文提出了第一个用于维护k-core的批处理算法。通过提出联合超边集结构,本文解决了量化k-core变化和减小搜索更新范围的难题。此外,本文还通过寻找能够并行执行的k-联合超边集结构来进一步加速更新过程。实验证明了k-core维护算法的效率、可扩展性和有效性,并且本文的并行算法随着线程数量的增加而实现线性加速。5.本文研究基于超图顶点参与度的紧密子图计算问题。顶点参与度对社会复原力和网络稳定性有着重要的意义。然而,反映实体间多元关系的超图中的顶点参与度还从未被研究过。本文证明超图中顶点的参与度可以由两个关键的参数捕获,即群体参与度和邻居参与度。此外,本文还提出基于顶点参与度的紧密子图模型(k,h)-core,以整合这两个衡量标准的优点,从而解决只使用单一参与度因素的无效性和不全面性。本文提出一种在线性时间内完成分解(k,h)-core的算法;提出一种小规模的局部更新算法来维护(k,h)-core,这极大避免了动态超图中重新分解的低效方式。广泛的实验证明本文模型的通用性和算法的有效性。
其他文献
研究背景股骨头坏死是中、西医骨科领域的疑难病,目前尚无专门针对股骨头坏死治疗的有效上市西药,终末期股骨头坏死患者以人工关节置换为治疗的终极方案。股骨头坏死从发病到疾病终末期这个过程中,各种药物与保髋手术被应用,目的是为了保住患者自身髋关节,达到延迟或避免关节置换。但各类保髋手术中,即便是应用范围最广、认可度最大的髓芯减压植骨其疗效也不能保证十分满意。中医药在股骨头坏死全病程管理中都有积极参与,其中
学位
双季稻是我国南方地区重要的农业生产模式,冬种绿肥和稻草还田则是维持农田土壤肥力和减少化肥用量的有效措施,但二者联合还田对双季稻的水肥效应仍不明确。为此,本研究以南方双季稻田为研究对象,于2013年-2016年开展了紫云英与稻草联合还田下节水减氮对双季稻生长发育、水氮吸收利用与流失、温室气体排放、产量品质等方面影响的系统研究,旨在揭示紫云英与稻草联合还田配合节水减氮下双季稻产量品质的形成基础及其环境
学位
天然气是一种重要的清洁能源,其主要通过地下长输管道方式进行运输,地下储气库方式进行储备。然而地下储气库和运输管道有泄漏的风险,天然气的主要成分甲烷是一种强温室气体,且易燃易爆,因此其一旦泄漏不仅会产生经济损失,还会带来安全和生态环境问题,因此及时、准确地检测泄漏点至关重要。传统的天然气泄漏直接检测方式费时费力,不仅会对周边环境产生一定破坏性,且难以实现大范围同步观测。天然气泄漏到土壤以后会引起地表
学位
我国市场经济制度逐步完善,市场经济发展效率不断提升。在经济新常态下,企业若想在强烈的国际竞争中站稳脚跟,需要主动开展优化与革新,以此推动经济价值提升。企业内部控制及经营管理关乎着企业的未来,而工商管理则是企业内部控制和经营管理的关键工具,探索工商管理的途径,才能让企业从市场中脱颖而出,从容地面对我国市场发展的变化。本文针对在市场经济新常态下,企业工商管理创新的途径,展开研究与讨论,期望对企业的成长
期刊
海岱地区是中华文明重要的发祥地之一,在中华文化形成和文明化进程中发挥着重要的作用。而龙山时代是海岱地区史前时期社会发展的关键时期,同时也是其巅峰期。研究海岱地区龙山时代的生业,探讨生业与社会的关系有助于探索海岱地区文明化进程的动因与机制,为我国的社会复杂化和文明化进程研究提供参考。本文以海岱地区的龙山时代为基本时空框架,依据系统的动植物考古证据和稳定同位素分析结果,对龙山时代的生业经济进行全面地研
学位
随着文职教员在我军院校建设中的地位与作用日益突显,加强文职教员队伍建设,打造一支理想信念坚定、矢志奋斗强军的文职教员队伍尤为重要。军校教育管理者应当重视文职教员的信仰教育,塑造文职教员正确的“三观”,为文职教员的成长与军队院校的发展提供精神源动力。
期刊
报纸
第一代到第五代移动通信在发展过程中不断进行代内创新和代际演进。纵观每一代的发展历程可知,在业务需求和外在技术的共同推动下,移动通信经由标准制定、产品研发、技术扩散,进而逐步形成移动产业生态。而构成移动产业生态的业务、网络和终端等三大构件,在技术、市场和规制等三大作用力的影响下,推动移动通信实现代际演进和跃升。基于三重螺旋模型的内核区、外场域以及循环流的特性,可以全面分析6要素之间的作用关系。创新性
期刊
<正>实验探究既是学习化学的重要方法,也是化学学习的重要内容,更是培养学生核心素养的实践基础。在初中阶段由于课时少,教学内容多,许多教师都因为怕影响教学进度,弱化了实验探究教学,甚至以其他教学方式代替实验探究,使实验探究的教育价值没有得到应有的发挥,导致化学教学中核心素养的培养得不到有效落实。把握好实验教学中"收"与"放"的关系是完成实验教学活动的保证,更是实验创新的基础[1]。
期刊
学位