复杂网络中的社团检测方法研究

来源 :兰州大学 | 被引量 : 17次 | 上传用户:a447047964
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实世界中众多的复杂系统都可抽象地表示为复杂网络,而社团结构是很多复杂网络最为显著的结构特征,其中的社团往往对应于网络的功能单元,从某种程度而言,整个网络的功能往往取决于社团之间的相互作用。通过检测网络的社团结构,可以在中观(mesoscale)结构层面探索网络的性质,研究网络的结构与功能之间的关系。此外,社团结构也能对网络的动力学特性产生重要的影响。因此,社团检测的研究不仅具有重要的理论意义,而且具有重要的实际应用价值,近年来吸引了计算机、物理、生物等多个学科研究人员的广泛关注,已成为复杂网络学科的一个研究热点。本文对已有的社团检测方法进行了深入的分析,针对这些方法中存在的问题与不足,提出了两类共5种社团检测方法。第一类方法关注的是如何从网络中检测得到尽可能精确的、高质量的社团结构,其中包括三种社团检测方法:(1)DBSCD:该方法首先利用一个稀疏化处理过程,从网络中移除可能位于不同社团之间的一些边,使得社团之间的边界变得清晰;接着使用谱二分法,基于网络转移矩阵第二特征向量中元素的符号,将网络分裂为两个子网络;然后在模块度的约束、指导下,以迭代方式使用同样的谱二分法对选中的子网络进行分裂,每一次迭代选中的都是其分裂能使得模块度增量最大的一个子网络。通过这样的持续分裂,得到最终的社团结构。(2)HBSCD:该方法同样先对网络进行稀疏化处理,使社团结构更加突出。接着基于网络转移矩阵第二特征向量中元素的符号,持续将网络分裂为一系列不可再分的子网络,并将每一个子网络当做一个社团,形成初始的社团结构。然后借鉴Fast算法的思想,通过合并其中一些社团得到最终的社团结构。(3)ASSCD:该方法将主动学习技术引入到社团检测的研究中,并与半监督社团检测算法结合,从网络中提取其社团结构。主动学习策略从网络中主动选取对半监督社团检测算法效用最大的顶点,生成高质量的Must-Link和Cannot-Link成对约束的半监督成分;半监督社团检测算法首先利用这些半监督成分构建初始的社团结构框架,然后充分利用它们以贪心方式对每一社团进行扩张,得到最终的社团结构。为了测试、验证这三种方法的性能,本文分别在一些实际网络数据集上进行了实验。实验结果证实,这三种方法均具有较强的社团检测能力,得到的社团结构质量明显优于对比方法。第二类方法的目标是从网络中高效地获取基本合理的、确定的社团结构,以克服一些运行效率较高的社团检测方法得到的结果具有不确定性的缺陷,并增强社团检测方法的泛化能力,方便对未知的新网络快速地进行探索性挖掘。主要包括两种社团检测方法:(1)VSAHCD:该方法受人类社交活动中选举投票行为的启发,首先通过模拟投票过程,让每个顶点按照一定的规则进行投票,得到一系列的小团体,然后分别使用两种策略,将其中一些小团体合并为较大的社团。一种策略借鉴了Fast算法的思想,每次合并能使得模块度增量最大并且相似性不为0的两个社团;另一种策略则合并相似性最大的两个社团,但确保合并操作能带来正的模块度增量。通过分别以这两种方式对小团体进行合并,得到最终的社团结构。(2)LPAd:该算法是对LPA算法的一个改进和增强,首先确定了一个合理的顶点序列,按照该序列的顺序,将其中每一顶点的标签更新为其邻居中最频繁出现的一个标签,同时也提出了存在标签竞争时的解决方案。通过这两方面的改进,使LPAd成为一个确定性的算法。然后在其运行得到的社团结构基础上,借鉴Fast算法的思想并结合相似性对其中一些社团进行合并,得到最终的社团结构。理论分析表明这两种方法均具有较高的运行效率。此外,本文也通过在5个实际网络数据集和2个LFR人工合成网络数据集上的实验,分别对这两种方法的性能进行了测试和评估。评估结果表明,这两种方法均能快速地从网络中检测得到比较合理的、确定的社团结构。
其他文献
目的探究瘢痕子宫再次妊娠经阴道分娩的可行性和安全性。方法选取我院2016年8月至2017年8月收治的瘢痕子宫再次妊娠产妇62例,依据实际分娩方式分为两组,甲组采用剖宫产,乙组
目的:分析无痛术在人工流产手术中的应用效果,总结临床经验,进而提高手术成功率。方法选择300例人工流产手术孕妇作为观察对象,按照随机抽样法将孕妇均分为观察组和对照组(n=150)。
免疫优化算法是受免疫学启发,模拟自然免疫系统功能、原理和模型来解决复杂问题的一种新的智能计算方法,已经广泛应用于各个领域。随着信息技术的飞速发展,产生了越来越多的
原子核及核能是原子物理中的核心内容,同学们在高三一轮复习时,必须弄清四类核反应的特点,熟练掌握五种粒子的本质,正确理解核反应中的四种守恒等。现将相关知识整合如下,以期帮助
目的总结难治性产科大出血实施子宫动脉结扎术治疗的价值,为产科临床治疗工作的开展提供参考,保证产科大出血患者的生存质量。方法选择我院收治的70例难治性产科大出血患者作
系统动态特性参数的时频域辨识方法作为模态分析领域的新进展和时频分析理论的新应用,正在逐渐引起国际学术界的重视。在总结了国内外模态分析发展历程,归纳了时频域参数辨识
定理 1:若△DEF是△ABC的垂足三角形,则△DEF的三边长分别为acosA、bcosB、CcosC.(如图1) 证明:因为BE⊥AC,CF⊥AB,所以∠BEC=∠CFB=90°,所以B、C、E、F四点共圆.所以∠AEF
随着时代的发展、科学技术的不断进步,最优化理论和算法越来越多的被广泛应用到我们的工作和生活中去。在现实生活中,很多问题都表现为离散的组合优化问题,例如旅行商问题、
赢得竞争优势,夺取领先地位,获得更大效益,成为全球经济竞争的新景观。名牌是信誉,是瑰宝,是人类文明的精华,是一个国家和一个民族素质的体现。既是物质体现,又是文化水准的体现。驰
有机/无机纳米复合材料(Organic/Inorganic Nano-composites)是近年来高分子材料科学的一个发展十分迅速的新领域。这种新型复合材料可以将无机物的刚性、尺寸稳定性和热稳定性