复杂网络中基于k-shell的社团发现方法

来源 :山东大学 | 被引量 : 0次 | 上传用户:nestle
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图论的起源可以追溯到17世纪欧拉对于哥尼斯堡七桥问题的研究。在20世纪60年代,著名的数学家Erdos和Renyi所提出的随机图模型构成了现代复杂网络研究的基本理论。在1998年和1999年的《科学》和《自然》上发表的两篇文章,分别揭示出绝大多数现实世界的复杂网络共有的性质:无标度性和小世界性,并建立了相应模型来描述这些特性的产生机理。这两篇文章的发表也开辟了复杂网络研究的新纪元。进入新世纪,学科之间的相互交叉,使得人们能够收集到广泛的不同类型的网络数据,并且随着计算机科学的迅猛发展,人们开始能够处理超大规模的复杂网络的数据。目前科研人员主要关注于研究复杂网络的以下几个方面:对于复杂网络的统计特性以及这些统计特征的度量方法和产生机制的研究、通过分析复杂网络的拓扑结构达到预测和控制整个网络的目的的研究,以及网络的结构稳定性和网络的演化动力学机制的研究等。复杂网络的社团结构是许多实际网络都具有的共同性质,复杂网络的社团结构的研究对于分析复杂网络的拓扑结构、深入了解网络的功能和对复杂网络的预测与控制具有重要的作用。复杂网络中的社团,也称聚类,是网络中相互关系比较紧密的节点构成的集合。迄今为止,已经有了对于社团划分的多种算法:基于模块度概念和贪婪思想的Newman分裂算法和凝聚算法,划分重叠社团的派系过滤算法,利用划分边的社团进而得到点的重叠社团的边社团算法等等。本文正是对复杂网络中的社团发现的研究与扩展。k-shell是新近提出的图论中的概念,研究表明,κ值大的k-shell层中的节点比传统研究中所考虑的度数大的节点对于图的拓扑性质以及网络中信息的传播所起的作用要大,最大κ值的k-shell中的节点更倾向于成为网络的中心,因此对于图的k-shell及其应用的研究也在逐渐兴起。对于k-shell的定义如下:定义1k-core是指图G的一个极大子图,在这个子图中的所有节点的度至少是κ。定义2把从(k-1)-core的点集中去掉k-core中的点所剩余的节点生成的子图定义为k-shell.并把图的所有的k-shell中具有最大的κ值的那一个记为kmax-shell。鉴于k-shell在网络拓扑结构中的重要作用,我们将其应用在社团发现的算法之中。首先,我们将k-shell与Newman凝聚算法相结合从而得到一个新的划分社团的算法。算法的基本思想是以kmax-shell中的节点为中心,然后利用使模块度最大化的贪婪思想,按照κ值由大到小的顺序逐层合并图中的剩余节点到kmax-shell的节点所在的社团中去,这样我们就得到了一个以kmax-shell中的节点为中心的社团结构,然后再使用凝聚算法对这个社团结构继续进行计算,最后我们选择网络中对应着局部最大模块度的那个社团划分。然后,我们将k-shell与边社团划分算法结合,得到一个新的划分重叠社团的算法。由于k-shell的重要作用,kmax-shell中的节点是图中的关键节点,那么与它们相连的边也是图中关键的边,所以我们优先考虑与kmax-shell中的节点相连的边的社团划分。我们逐步选择kmax-shell的节点周围的边相似度最大的、没有被考虑过的相邻的边对,并将它们合并到一个社团中,直到kmax-shell中的节点周围的所有边的社团所包含的边的数目都大于1。然后逐渐减小κ值,再用同样的方法,逐步合并相应的k-shell中节点周围的边对所属的两个社团。这时我们得到了网络的一个边社团结构,再用原始的边社团算法对这一个已经有了一定的边社团划分的网络进行计算,直到所有的边都被划分到一个社团内为止。最后我们选择对应着局部最大划分密度的那个边社团的划分作为最后的划分,再用边的社团标号来标记边的两个端点所属的社团,这样就得到了一个网络中节点的重叠社团结构。经过对上述两个算法的实际测试发现,我们的算法比原来相对应的算法有更好的划分结果,并且算法的复杂性也没有数量级上的增加,但是所得到的社团却有了更加现实的意义。最后我们将k-shell、模块度、边相似度和划分密度的定义推广到赋权图之中,然后将其应用到赋权图的社团发现方法之中,这样我们就得到了赋权图的基于k-shell的社团划分算法。
其他文献
在水处理中,絮凝剂是混凝过程中的主要因素,一直以来铝盐是世界上使用最多的传统絮凝剂。近年来,在传统铁盐和铝盐的基础上,无机高分子絮凝剂(IPFs)正迅速发展并得到广泛应用
基于问题学习法是国际医学教育的主流教学方法。循证医学是关于遵循证据进行医学实践的学问。在本科全科医学教学中,引入以循证医学为导向的基于问题学习法,在增强学生学习融
目的本研究旨在了解急性心肌梗死(AMI)患者心理弹性水平现状,分析心理弹性动力系统模型中的个人、家庭、社会各因素与AMI患者心理弹性之间的关系,探讨AMI患者心理弹性的保护
摘要:本文简要论述了如何搞好小学作文教学?旨在培养学生的写作兴趣,激发学生爱作文的情感,以便提高作文教学质量,实现教育目的。  关键词:小学;作文;教学;观察;命题;创新  小学生作文就是练习把自己看到的、听到的、想到的内容或亲身经历的事情,用恰当的语言文字表达出来。但小学生往往容易忽略身边的事情,不容易挖掘身边的题材。这就需要教师加以恰当的引导,引导他们在写作文时要做到说真话、诉真情,能在大量的
都市农业作为城市生态系统的重要组成部分,在城市生态系统服务功能的发挥及城市可持续发展维持方面具有重要价值。利用生态经济学方法,从都市农业的自然属性、社会经济属性出
BIM技术已经成为当前建设领域信息技术研究和应用的热点,工程造价行业领域受到BIM技术的影响,将极大地改变原有的工作方式。高等院校工程造价专业应紧跟时代发展趋势,注重BIM
对口援疆是国家引导下的特殊跨区域经济合作关系,是解决区域发展不平衡、促进少数民族地区经济增长的重要手段。随着2010年新一轮对口支援新疆工作的实施启动,亟需加强该领域
目的:通过对冷凝集阳性现象所引起的疑难配血患者的血样进行了血清学分析,了解什么是冷凝集,以及冷凝集素对交叉配血的影响并探索冷凝集阳性患者在交叉配血中的处理对策。方
<正>(安徽芜湖·2010年12月21日)这次国家商标战略实施示范企业经验交流暨商标运用保护会议的主要目的是,认真总结回顾首批示范企业实施商标战略的好经验和好做法。进一步提