一种高效的复杂网络重叠社团挖掘算法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:wp840716
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
复杂网络的重叠社团挖掘算法用来解决识别复杂网络中重叠社团的问题,有助于获取与了解复杂网络的整体结构特性。由于重叠社团挖掘中一个节点可能属于多个社团,用传统的社团挖掘算法无法识别出同属于多个社团的节点。随着社会和科技的发展,复杂网络的规模越来越大,现有的重叠社团挖掘算法在处理如此大规模的网络时效率较低。因此,需要更快速的算法来更好的应对大型复杂网络中重叠社团挖掘问题。本文提出一种先在整个网络中选取种子,后通过收益函数对种子进行局部优化,发现复杂网络的重叠社团结构的算法。工作主要分为两部分,首先,在整个网络中选取种子,本文提出了两种播种策略:“社团扩张”和“高度节点扩张”。“社团扩张”播种策略使用Louvain算法对网络进行初始划分,将得到的划分结果作为种子集合;“高度节点扩张”播种策略采用度优先的方式选取种子,这里需要注意的是,本文使用的度优先选取种子的方式考虑到已选种子对后续选取种子的影响,在每次确定一个种子之后都对剩余节点的度进行更新。然后,用收益函数对种子集合中的种子依次优化,从每个种子进行扩张。通过收益函数判断邻域节点是否可以加入社团以及社团内部节点是否删减,直到收益函数达到局部最优,确定社团结构。本文提出的算法避免了在挖掘社团的每次迭代中搜索整个网络。本文从理论上对算法的时间复杂度进行分析,并在真实数据集上进行实验,从算法运行时间与实验结果准确性两方面验证算法的性能,且与BigClam算法,OSLOM算法,DEMON算法进行对比。实验结果表明,本文提出的算法中,在通过Louvain算法选取种子时,算法准确率略低于所对比的DEMON算法,但是算法的运行效率高于所对比的三种算法,且明显高于BigClam算法。在使用度优先策略选取种子时,算法的运行效率与准确率均高于所对比的三种算法。本文提出的算法能准确的挖掘出复杂网络中的重叠社团,并具有高效的优点,可以用于大规模复杂网络重叠社团挖掘。
其他文献
日本囊对虾(Marsupenaeus japonicus)是最具养殖价值的对虾品种之一。高氨氮、低pH是影响其养殖效果的重要环境因子,由于工厂化养殖模式下饵料及排泄物的积累、人类活动及气
分数阶对流扩散方程是一类重要的数学模型,它常用于描述反常扩散的或非指数松弛的复杂系统中的传输过程.本文为一类时间多项分数阶对流扩散方程构造了一种时空有限元全离散格式,并提出了一种高效的自适应代数多重网格(AMG)法.首先,在时间和空间维度上均采用线性有限元方法,所得全离散格式的系数矩阵为并证明:(1)AAhτn是M矩阵,且当空间步长h≤1/7时,其行和具有正下界;(2)当β不小于某个正常数时,Ah
小细胞肺癌(SCLC)是支气管黏膜上特殊类型的肺癌。SCLC细胞具有倍增速度快、恶性程度高、早期转移等特点,这导致SCLC临床治愈率较低。目前常规化疗或放疗对SCLC疗效有限,仍缺
墨西哥湾扇贝(Argopecten irradians concentricus)自引入北部湾推广养殖以来已有二十多年,已形成规模化产业链,是当地重要的经济贝类,但由于累代小群体养殖,墨西哥湾扇贝种
大数据时代,挖掘海量信息中蕴含的价值,对海量信息进行快速处理成为各个行业的迫切需求。随着Spark的广泛应用,Spark SQL作为一个基于Spark的分布式查询组件,利用Spark内存计
西藏申扎县雄梅镇调查区位于藏北高原腹地班公错—怒江缝合带中,处于羌塘地体与拉萨地体中间。地层属于滇藏大区的冈底斯—腾冲地层区和班公错—怒江地层区。区内的构造形迹完全受结合带的演化控制。调查区内出露的永珠蛇绿岩是班怒缝合带南部分支狮泉河-永珠-嘉黎蛇绿岩带的中间一小部分。调查区的地质构造凌乱,矿产储量较大。该区属于班—怒成矿带之班戈铜多金属成矿预测区,南邻冈底斯-藏南成矿带,成矿条件极有利。目前区内
生物多样性与生态系统功能之间的相互关系(Biodiversity and ecosystem functioning,BEF)是生态学研究的热点话题,其中,植被与土壤作为维持草地生态系统功能的重要环境因子对于生物多样性保护意义重大,然而草地类型及管理方式的差异将会影响物种分布与环境之间的关系,以步甲为代表的地表节肢动物对于环境变化尤为敏感。因此,本研究采用巴氏罐诱法于2017至2018年对宁夏三种
在控制系统的研究中,系统的稳定性、可控性和可观测性是解决理论问题与实际问题的几个重要方面.而在许多情况下,对这些问题的研究常常可以转化为相应的Riccati矩阵方程的半正定解或半正定解的上下界估计.近年来,代数Riccati矩阵方程半正定解的上下界估计和解的迭代算法受到许多学者的极大关注,并且获得了一些重要的研究成果.本文获得了离散耦合Riccati矩阵方程(DCARE)对称半正定解的存在区间,半
随着移动互联网的快速发展,信息生产者和信息消费者所面对的信息过载问题越来越严重。推荐系统的产生在一定程度上缓解了这个问题,使得人们可以从海量信息中更加准确、及时的