基于增量聚类的动态社团检测算法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:huiyongq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据的大规模增长,对于社团检测算法的研究日益成为复杂网络学科中的一个热点和挑战。在网络中检测社团可以分析网络结构,了解网络结构中隐藏的关键信息。在过去的十几年中,静态网络的社团检测算法得到了长足的发展,但是,现实生活中网络都是动态网络,网络随着时间不断发生缓慢的变化。对动态网络进行社团检测、分析,能够帮助人们认识网络的结构、分析网络的发展趋势,对于现实生活意义非凡。然而传统的静态社团检测算法会忽视网络之间的时间演化关系,得到的社团难以解释和进一步分析;进化聚类算法需要平衡前一时刻和当前时刻网络上的可能存在矛盾的指标,导致算法效率不高;一些增量聚类算法在更新社团时存在一定的损失。如何高效且准确的在动态网络中检测社团,成为了动态网络分析中的一个难题。大多数已有的动态社团检测算法,在运行时间和算法准确度上不能同时满足需求。本文提出了一种基于weak-clique和增量聚类的动态社团检测算法DWCI,首先改进了W-CPM静态社团检测算法的weak-clique识别方法和weak-clique的合并方法,提高W-CPM算法准确率;然后基于增量聚类算法,定义了weak-clique的核和受扰动节点集合,并且通过验证当前时刻weak-clique的核以及计算增量节点和weak-clique的核之间的关系,确定受扰动节点集合;最后对受扰动节点集合重新计算社团。通过时间复杂度分析发现,DWCI算法具有增量聚类的高效性。本文在合成数据和真实网络上进行实验,将DWCI算法与经典的进化聚类算法Facetnet、增量聚类算法IC、d Louvain-ΔS,从准确性与运行时间两方面进行对比。在DBLP网络中,本文算法运行时间低于其他算法,比d Louvain-ΔS算法缩短6倍左右,比IC算法缩短30%左右,Facetnet算法由于运行时间过长不具有可比较性;社团模块度指标显著高于IC算法,和d Louvain-ΔS算法处于相同水平。在CELLPHONE网络中,本文算法运行时间比d Louvain-ΔS算法缩短1-2倍,比Facetnet算法缩短100倍;社团模块度指标略低于Facetnet算法,但是高于IC算法和ΔS_louvain算法。在1万节点、5万节点和10万节的合成网络中,本文算法运行时间和IC算法相当,比d Louvain-ΔS算法缩短3-4倍,此时Facetnet算法运行时间过长不具有可比较性。通过实验验证发现,DWCI算法时间效率明显高于Facetnet算法和d Louvain-ΔS算法,和IC算法时间效率相当,具有增量聚类的高效性;在准确性方面,DWCI算法明显高于IC算法,大部分情况下高于d Louvain-ΔS。总而言之,本文提出的算法DWCI是一个时间效率高,准确性也相对较好的动态社团检测算法。
其他文献
微电网作为利用分布式电源的有效手段,凭借其运行控制和能量管理技术,可以充分利用分布式电源,促进未来智能电网发展。绝大部分的分布式电源都是通过逆变器接入微电网,逆变器
本文以发光金属有机框架材料(LMOFs)荧光传感筛选出的肺癌患者呼气VOCs标志物为研究背景,提出如何提高LMOFs材料对筛选出的己醛、乙苯、1-丙醇、苯乙烯和异戊二烯的特异性识别
聚合物固态电解质能够有效地避免有机液态电解质中存在的安全问题,因此其在锂离子电池(LIBs)中具有非常优异的应用前景。然而,聚合物固态电解质低的离子电导率(<10-5 S cm-1)限制了它的广泛应用。在本论文中,我们以聚偏氟乙烯(PVDF)基电解质作为研究对象,分别考察了当具有一维结构的氧离子导体Sm0.2Ce0.8O1.9(SDC)纳米线和在大自然中富集的埃洛石纳米管(HNTs)作为无机
目的:本论文依据导师刁军成教授以妇人多肝郁气滞的理论指导临床,探讨从气滞血瘀论治子宫腺肌病痛经的临床经验总结,为临床治疗子宫腺肌病痛经拓展新思路,新用方。方法:查阅所有文献中关于痛经的章节,并对历代医家论述有关子宫腺肌病的文献进行整理分析;选择门诊跟师时获取的典型病例进行记载、分析、判断疗效,整理刁军成教授有关子宫腺肌病痛经的学术思想及其对此病治疗的临床经验,分析导师刁军成教授对气滞血瘀型子宫腺肌
目的描述二胎产后返岗护士的焦虑现状;分析二胎产后返岗护士焦虑的影响因素,为其心理健康干预提供理论依据。方法1.本研究属于横断面现况调查。采用方便抽样方法,抽取江门地区共701名二胎产后返岗护士作为研究对象,研究工具包括一般资料调查表、焦虑自评量表、简易应对方式问卷、家庭功能量表及社会支持评定量表。2.运用SPSS 21.0软件进行统计分析。计数资料采用均数和标准差,计量资料采用频数和构成比,描述二
柴油机传动轴系是船舶动力装置的重要组成部分,其运转的可靠性和稳定性都将直接影响船舶的运行。目前对柴油机轴系扭转振动问题的研究,大多是根据线性理论,但这已经不能满足现代船舶工业的发展需求,虽然也有许多关于弹性联轴器和齿轮等非线性元件的研究,但是对于复杂系统进行整体非线性特性的研究还是较少,这也就使得本文的研究具有了重要的实际意义。本文以某型船舶柴油机轴系为研究对象,考虑弹性联轴器刚度非线性和齿轮内部
通过对渤南油田义176块沙三段地区的地层研究发现,该研究区体现较强的非均质性,运用以往的的均质模型参数对该研究区分析的话显然不符合实际情况,本文在三轴岩石力学、古地磁
目的建立小鼠大脑脑片炎症模型,研究褪黑素(Melatonin,MEL)通过其受体对脂多糖(Lipopolysaccharide,LPS)诱导的中枢神经炎症的保护作用及机制,为进一步探索褪黑素对中枢炎症及相关脑内疾病的作用机制提供理论基础。方法取出生后10天小鼠,制备小鼠大脑切片,实验分为四组:CTRL组、LPS组(LPS处理24h)、LPS+MEL组(MEL预处理6h后给予LPS处理24h)、ME
随着社会可持续发展的迫切需要,发展绿色能源储存和转换技术至关重要。析氢反应(hydrogen evolution reaction,HER)作为电解水和氢燃料电池等各种装置的必要步骤,在过去几十年
研究目的:α-甲亚基内酯化合物普遍存在于各种天然产物中,且具有多种生物活性,在药物开发中具有重要的研究价值。本课题拟建立一种简单有效的合成方法,以二烯酸作为底物合成一系列具有活性的卤代α-甲亚基内酯化合物,并初步测试该系列化合物对野生型和突变型非小细胞肺癌细胞的细胞毒性。研究方法:以戊二烯酸及其衍生物为底物,分别经过氟代、氯代、溴代和碘代,合成系列不同卤代α-甲亚基-γ-丁内酯化合物;然后针对α-