基于EgoNet的复杂网络重叠社区发现算法研究

来源 :上海大学 | 被引量 : 0次 | 上传用户:gabby11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社区结构(Community Structure)是复杂网络的一个重要特征,它具有社区内部节点连接相对紧密而社区之间节点连接相对稀疏的特点。发现网络中的社区结构对理解网络拓扑结构和挖掘网络底层隐含信息起着重要作用。因此,在复杂网络中进行社区发现算法研究成为近年来的研究热点之一。传统的社区发现算法主要研究非重叠社区结构的网络,即网络中的节点能且能归属于一个社区。然而,在现实世界的网络中,大多数实体都具有多种属性,抽象到复杂网络中,表现为网络节点可以同时属于多个社区,这使得研究重叠社区具有更现实的意义。目前而言,研究一模网络(即网络中只有一种类型的节点)重叠社区发现的算法已经有很多,这类算法主要存在两方面的不足:一方面,已有算法大多都是从宏观角度对复杂网络进行社区发现,然而,当网络中出现社区间边的密度高于社区内部边的密度时,这类方法就变的无能为力了;另一方面是随着网络规模的增大,这类算法消耗的时间往往呈非线性增加。近年来,研究者引入微观一模网络模型EgoNet,开辟了从微观角度来解决复杂网络社区发现问题的先河。EgoNet是由中心节点Ego、邻居节点Alter以及这些节点之间的边一起构成的微观网络模型。该模型可以有效的抽取网络节点间的微观特征,传统宏观角度的方法难以解决的问题,利用EgoNet却变得很容易解决。同时,很多已发表的研究成果也证明了基于EgoNet的社区发现算法在准确率上有很大的提高。鉴于EgoNet的上述优点,本文提出了一个微观二模网络模型Bi-EgoNet,并对其基本特性做了简单的研究。本文的主要研究内容是利用EgoNet和Bi-EgoNet模型对一模网络和二模网络中的社区发现问题进行研究。首先,研究了EgoNet在无向无权网络中的有效性,提出了基于亲密度的重叠社区发现算法OCDFI(Overlapping Community Detecting algorithm based on Friend Intimacy)。针对传统的基于EgoNet的社区发现算法中存在的合并社区负担重,且准确率不高等问题。本文利用EgoNet模型,从每一个EgoNet中只提取一个以Ego为中心的,朋友亲密度较高的局部社区。算法从每一个EgoNet中只提取一个社区,可以有效降低社区合并的负担。同时社区中只包含与Ego的朋友亲密度较高的Alter,可以确保这些Alter与Ego有较高的概率属于同一社区,这在一定程度上增加了发现社区的准确性。OCDFI算法在人工网络和真实网络中进行了验证,并与其他经典的算法比较,实验表明算法具有较高的准确性,平均准确性能提高13.39%。其次,研究了EgoNet在有向无权网络中的有效性,提出基于关注度的重叠社区发现算法OCDAD(Overlapping Community Detecting Algorithm based on Attention Degree)。所谓关注度是指如果节点A指向节点B,那么节点A就关注了节点B。一般而言,节点间关注度的影响会随着距离的增加而变弱。传统的关注度计算方法只考虑直接共同邻居节点的关注度,这在一定程度上降低了关注度计算的准确性。本文将Ego间接邻居ex-Alter加入到EgoNet模型,使其扩展为Ex-EgoNet模型。基于该模型,在计算Alter对Ego的关注度时除了考虑直接共同邻居的影响还同时考虑了间接共同邻居的影响。OCDAD在已知社区结构和未知社区结构的真实网络中进行了实验,与经典的有向网络社区发现算法OSLOM和Infomap相比,OCDAD算法在时间消耗上比OSLOM算法要少的多,比Infomap算法略差,但在平均准确性上都优于这两个算法,提高了约35%。再次,从微观角度研究了二模网络重叠社区发现问题,提出了基于Bi-EgoNet的重叠社区发现算法。二模网络是包含两种不同类型节点的特殊复杂网络。众所周知,利用EgoNet发现一模网络中社区结构的算法相对传统的算法而言,在准确性和有效性上都有较大的提高。然而,到目前为止,却没有看到可用于发现二模网络社区结构的微观网络模型。基于此,本文将EgoNet进行了扩展,并提出了微观二模网络模型Bi-EgoNet。同时,提出基于Bi-EgoNet的二模网络重叠社区发现算法OCDBEN(Overlapping Community Detecting Algorithm of bipartite network based on Bi-EgoNet)。在人工网络和真实网络中的实验结果表明,OCDBEN在时间和准确率上均优于其他算法:随着网络规模的增加,我们的算法在时间消耗上明显的少于其他两个对比算法(Cui’s method和Wang’s method),平均准确率上也提高了约15.71%。最后,提出了基于完全二分图的重叠社区发现算法OCDCBG(Overlapping Community Detecting of bipartite network based on Complete Bipartite Graph)。传统的基于极大完全子图(或派系)的算法在发现一模网络的社区结构中,有着较大的优势。完全二分图是一种特殊的二分图,其特性类似于一模网络中的完全子图,即完全二分图中每一个节点都属于同一个社区。基于此,本文将完全二分图的不可分割特性和Bi-EgoNet微观特性结合,提出基于完全二分图的二模网络重叠社区发现算法OCDCBG。在人工和真实的网络中的实验结果表明,OCDCBG算法均优于两个经典的算法(Cui’s method和Wang’s method),平均准确率提高了约21.41%。
其他文献
目前,日益增长的应用需求对储氢合金电化学容量、循环稳定性以及高倍率放电性能提出了更高的要求,迫切需要开发新型储氢合金电极材料。为了缩短合金开发周期,本文首先借助热力学相图建立了RE-Mg-Ni(RE=Nd,Y,Ce)体系的电化学容量图,并根据最大放电容量确定以La-Y-Ni体系作为研究对象。为解决该体系合金的氢致非晶化问题,探究了Mg、Mn分别替代和共同替代对La-Y-Ni体系ABn型合金物相及电
衬砌结构作为地下工程重要的支护结构,应用于热力管道、城市地铁、石油和天然气运输管道以及海底隧道,这些地下结构常受到高温、冲击等作用。因此,各种热源、力源引起的土-衬砌系统热弹性动力响应备受关注。目前关于土-衬砌系统的热力耦合和热水力耦合动力响应的研究鲜有涉及。本文考虑土与衬砌的相互作用,研究了热力耦合作用下弹性土-衬砌系统的热弹性动力响应、深埋圆形隧道衬砌-土系统的热扩散效应、饱和土-圆形衬砌系统
Ni-Mn-Ga铁磁形状记忆合金由于具有大的输出应变和高的响应频率,不但具有传统热诱导形状记忆合金的特点,而且在磁场作用下能够产生形状改变,因而能在非接触调控下做出快速灵敏的响应。此外有γ相参与的Ni富集的Ni-Mn-Ga高温形状记忆合金,因其较高的马氏体相变温度(350℃以上)和极佳的延展性(超过30%的应变)吸引了广泛的研究兴趣。然而γ相的存在会阻碍马氏体孪晶的移动,影响退孪生行为。其中,基体
冶金熔体物化性质直接影响着冶炼工艺的优化及产品质量的控制。由于高温实验困难,因此在有限实验基础上的模型预报是获取此类性质数据的重要方法。目前,多元熔体物化性质的计算主要依靠唯象模型,其中,几何模型因其简洁有效的形式而成为应用广泛的一类唯象模型。几何模型主要是根据多元系边界性质对其内部性质进行预测的一类方法,其发展至今主要面临三大难题:a)如何发展边界拟合方法及权重分配方式?b)如何发展局部互溶几何
现代设计在不断渗透人们生活和工作的过程中,展现出其强大的影响力,而中国平面设计深受现代设计思潮的影响,无论是设计硬软件,还是设计理念或者模式,都不同程度地受到西方设计思维和机制的影响。显然在满足人们平面审美诉求的过程中,如果仅仅停留于模仿,往往难以达到理想的状态,此时就需要切实地思考这样的问题:如何将优秀传统文化元素融入到中国平面设计中去。从这个角度入手,首先思考现代设计思潮对于中国平面设计的影响
热电材料是一种能够实现热能与电能直接转换的材料,可以利用其Seebeck效应进行温差发电,也可以利用其Peltier效应实现制冷和制热,在废热发电、电子器件制冷领域具有重要的应用价值。Bi2Te3基化合物,在室温区具有优异的热电性能,已经广泛应用于商用制冷器件。通过掺杂、固溶、纳米化等手段,可以大幅提升Bi2Te3基块体材料的热电性能。作为一种成熟的商用热电材料,需要具备优异的热电性能、较短的制作
热电材料是利用塞贝克效应与帕尔帖效应实现电能与热能相互转换的功能材料,在废热回收再利用和固态制冷领域有着广泛的应用。热电材料的能量转换效率正比于无量纲热电优值z T,而z T由材料内部的电子和声子的输运过程所共同决定。因此,提高热电材料的z T值需要电声输运的协同优化。然而,决定电声输运的三个主要性能参数(电导率,塞贝克系数,热导率)相互耦合作用强烈,利用传统优化手段针对某一个参数进行优化通常会导
针对低品位、复合共伴生矿产资源利用率低的现状,应用“低温还原-磁选或熔分”思路,将铁与其他有价元素进行分离。为了提高低温还原的反应效率,本文首次提出将稳恒磁场作用于铁矿还原过程,以期实现磁场对铁矿还原的强化作用,为开发低品位、复合共伴生铁矿低温磁场强化还原技术提供理论基础与技术支持。基于经典热力学模型、固态相变理论及磁能理论,将磁能引入含铁矿物固态还原过程,提出了磁能反应热力学模型、磁能形核热力学
水资源危机是本世纪人类面临的最大危机之一。为了应对水资源危机,大力发展水处理技术成为必然选择之一。电容去离子技术是近些年来新兴起的水处理技术,具有低能耗、高效率、无污染、可循环使用的优点,因此有很大的发展前景。电容去离子技术的核心是电极材料,现有的电极材料主要包括活性炭、碳气凝胶等,但是它们的容量有限,性能不能满足大规模工业化生产的要求。石墨烯作为一种新型碳材料,具有高导电性和高理论比表面积的优点
微分动力系统分析方法的理论研究及其在其它领域中的应用,是应用数学中的两个重要内容.本博士学位论文就在动力系统的理论和应用两个方面进行了研究,主要做了三方面的工作:建立且分析了一个有向关联网络上的传染病模型,推广了平面动力系统中的旋转数理论,并且利用Conley指标理论研究了双吸引子间的动力学结构.文中的主要内容概述如下:首先,越来越多的迹象表明,许多真实的网络之间是相互作用的,并且有时网络上的疾病