复杂网线中基于K-shell的社团发现方法

来源 :山东大学 | 被引量 : 0次 | 上传用户:digital78
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图论的起源可以追溯到17世纪欧拉对于哥尼斯堡七桥问题的研究。在20世纪60年代,著名的数学家Erd(o)s和Rényi所提出的随机图模型构成了现代复杂网络研究的基本理论。在1998年和1999年的《科学》和《自然》上发表的两篇文章,分别揭示出绝大多数现实世界的复杂网络共有的性质:无标度性和小世界性,并建立了相应模型来描述这些特性的产生机理。这两篇文章的发表也开辟了复杂网络研究的新纪元。进入新世纪,学科之间的相互交叉,使得人们能够收集到广泛的不同类型的网络数据,并且随着计算机科学的迅猛发展,人们开始能够处理超大规模的复杂网络的数据。目前科研人员主要关注于研究复杂网络的以下几个方面:对于复杂网络的统计特性以及这些统计特征的度量方法和产生机制的研究、通过分析复杂网络的拓扑结构达到预测和控制整个网络的目的的研究,以及网络的结构稳定性和网络的演化动力学机制的研究等。   复杂网络的社团结构是许多实际网络都具有的共同性质,复杂网络的社团结构的研究对于分析复杂网络的拓扑结构、深入了解网络的功能和对复杂网络的预测与控制具有重要的作用。复杂网络中的社团,也称聚类,是网络中相互关系比较紧密的节点构成的集合。迄今为止,已经有了对于社团划分的多种算法:基于模块度概念和贪婪思想的Newman分裂算法和凝聚算法,划分重叠社团的派系过滤算法,利用划分边的社团进而得到点的重叠社团的边社团算法等等。本文正是对复杂网络中的社团发现的研究与扩展。   k-shell是新近提出的图论中的概念,研究表明,k值大的k-shell层中的节点比传统研究中所考虑的度数大的节点对于图的拓扑性质以及网络中信息的传播所起的作用要大,最大k值的k-shell中的节点更倾向于成为网络的中心,因此对于图的k-shell及其应用的研究也在逐渐兴起。对于k-shell的定义如下:   定义1 k-core是指图G的一个极大子图,在这个子图中的所有节点的度至少是k。   定义2把从(k-1)-core的点集中去掉k-core中的点所剩余的节点生成的子图定义为k-shell。并把图的所有的k-shell中具有最大的k值的那一个记为kmax-shell。   鉴于k-shell在网络拓扑结构中的重要作用,我们将其应用在社团发现的算法之中。首先,我们将k-shell与Newman凝聚算法相结合从而得到一个新的划分社团的算法。算法的基本思想是以Kmax-shell中的节点为中心,然后利用使模块度最大化的贪婪思想,按照k值由大到小的顺序逐层合并图中的剩余节点到Kmax-shell的节点所在的社团中去,这样我们就得到了一个以kmax-shell中的节点为中心的社团结构,然后再使用凝聚算法对这个社团结构继续进行计算,最后我们选择网络中对应着局部最大模块度的那个社团划分。然后,我们将k-shell与边社团划分算法结合,得到一个新的划分重叠社团的算法。由于k-shell的重要作用,kmax-shell中的节点是图中的关键节点,那么与它们相连的边也是图中关键的边,所以我们优先考虑与kmax-shell中的节点相连的边的社团划分。我们逐步选择kmax-shell的节点周围的边相似度最大的、没有被考虑过的相邻的边对,并将它们合并到一个社团中,直到kmax-shell中的节点周围的所有边的社团所包含的边的数目都大于1。然后逐渐减小k值,再用同样的方法,逐步合并相应的k-shell中节点周围的边对所属的两个社团。这时我们得到了网络的一个边社团结构,再用原始的边社团算法对这一个已经有了一定的边社团划分的网络进行计算,直到所有的边都被划分到一个社团内为止。最后我们选择对应着局部最大划分密度的那个边社团的划分作为最后的划分,再用边的社团标号来标记边的两个端点所属的社团,这样就得到了一个网络中节点的重叠社团结构。   经过对上述两个算法的实际测试发现,我们的算法比原来相对应的算法有更好的划分结果,并且算法的复杂性也没有数量级上的增加,但是所得到的社团却有了更加现实的意义。最后我们将k-shell、模块度、边相似度和划分密度的定义推广到赋权图之中,然后将其应用到赋权图的社团发现方法之中,这样我们就得到了赋权图的基于k-shell的社团划分算法。
其他文献
田11-斜14井设计井深3148米(垂深2890),三靶点,10米靶半径,要求实际井身最大偏移不得超过设计轨迹10米,本井斜井段长1100米。
随着我国教育制度的不断改革,只有不断开发教育信息化过程中优秀的人力资源,才能够提升人们的科学文化知识,提升教育的文化底蕴,从而促进教育信息化的进程.人力资源的开发在
多属性决策(MADM)是决策理论的重要组成部分,目前已在项目评审、人事管理、维修服务、投资策略等诸多领域有着非常广泛的应用,该文对属性指标值为区间粗糙数的决策问题进行了一
离散动力系统是动力系统的一个重要分支,运用离散动力系统描述一些实际问题和现象是大多数学者普遍接受的.然而,存在很多复杂的系统涉及两个或两个以上相互作用,这些系统不能被
量子群理论的研究是近年来兴起的一个数学分支,是代数学领域中重要研究内容,自上世纪八十年代中期发展至今,其理论被许多数学家广泛讨论。本硕士论文主要研究当q是e-次单位根
在信息技术发展迅速的市场环境下,企业之间的竞争演变成了供应链之间的竞争.选择合适的契约来协调供应链已经成为企业之间竞争最为有效的手段之一.在协调供应链时,人们往往站在绝对理性的基础上,忽略了供应链成员的行为偏好对供应链协调的影响.基于以上情况,本文以公平关切的零售商和公平中性的供应商组成的二级供应链为研究对象,将供应链系统视为公平关切的,采用分段线性效用函数作为他的效用函数,基于期权契约、批发价和
显著性度量在图形图像基于内容的处理领域中起到重要的作用,本文针对二维图像和三维模型分别给出一种显著性度量,并分别给出了基于其显著性度量的一些应用.在二维图像的显著度检
本文通过对荣华二采区10
期刊
计算由大量元件构成的关联系统的签名档是一项困难的工作,这篇论文首先推导出了两个基本的公式来计算那些可以分解为两个子系统(模块)的系统签名档,应用这两个公式,根据原始系统和
随着委内瑞拉钻井服务市场的细化,钻井液固控服务业务已经从钻机服务业务中分离出来,以美国的BRANDT、SWACO、DERRICK等公司为代表,国外的固控设备早已尺度化、系列化和专用化,服