面向复杂网络的社区发现算法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:moccaaa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络是一种呈现复杂系统的有效方法。复杂网络(complex network)描述了一系列的自然和社会系统,例如信息系统、生物系统、社会系统、交通系统、航空网络、电力系统以及一些合作性质的网络系统等。自然界中大量真的网络都具有其独特的结构特点,系统内部个元组之间的联系以及相互作用,可以抽象为具有一定组织关系的小型网络,这种小型网络承担着系统的功能,并且能够具体的体现网络中的组织关系特点。这些小型网络就定义为复杂网络的社区结构(community)。复杂网络中社区发现的研究可以揭示复杂网络结构特点和一些网络现象的成因。将复杂网络中的个体划分为不同的社区结构进行研究,可以有针对性的对复杂网络的某些特征进行研究,也可以减少对复杂网络某些特征研究的工作量。因此,复杂网络的社区发现方法的研究具有巨大的社会、经济和科研价值。本文针对复杂网络,首先,基于Louvain社区发现算法的启发,提出了基于社区相似的层次聚类社区发现算法(CSHC)。算法初始阶段将每一个结点作为一个社区,然后提出社区之间的相似性和模块度最大增益之间的一个合并系数,决定社区是否合并,迭代算法的停止条件为达到需要划分的社区个数k为止。CSHC算法分别在Karate ClubNetwork数据集和American College Football数据集上得到了很好的社区划分,其纯度与模块度对以往的社区发现算法都有一定的提高。并且CSHC算法可以在很少次的合并达到社区划分结果,与以往社区发现算法相比其效率大大增加。其次,本文提出了基于重要结点的社区发现算法(INC),首先依据模块度最大化理论,计算出网络的模块度矩阵B的最大k特征向量矩阵S。然后,提出聚类中心方法用于求出k个社团的重要结点作为k聚类中心。利用欧几里得距离计算每一个结点到k个聚类中心的距离,将结点分配到距离聚类中心最近的社区中。最后,对网络应用k-means方法进行迭代计算,最终得到k个社区的划分。INC算法分别在Karate Club Network数据集和American CollegeFootball数据集上得到了很好的社区划分,并且可以有效的发现潜在社区,其纯度与模块度对以往的社区发现算法都有一定的提高。并且INC算法可以在很少次的迭代达到社区划分结果,与以往社区发现算法相比其效率有很大提高。复杂网络内部的各个社区结构是复杂网络结构特征的具体承担者和复杂网络属性特征的具体体现者。另外,在系统内部,并不是所有的元组个体对复杂网络的特征和结构都起到一样的作用,一些元组会扮演更为重要角色,这种元组被称为网络中的关键结点。因此,本文提出了基于社区的重要结点评定方法,既充分的考虑到一个结点与其他所有结点之间的紧密程度,又充分考虑到结点在社区中的贡献,提出ICC算法对网络中结点进行重要性的评定。ICC算法分别在Karate Club Network数据集和AmericanCollege Football数据集进行实验验证,并与经典的中心性计算方法进行对比。实验结果表明,ICC算法很好的将社区中重要结点对网络的实际意义凸现出来,对网络中重要结点的评价有了新的视角,并且对网络的实际意义做出很好的评判。现代科学的网络为复杂网络的理解带来了重大的发展。复杂网络中社区发现与社区发现算法的研究对关键问题的讨论、集群的意义以及对真实网络的描述具有重要的意义。由于复杂网络中每个结点的重要程度不同,对复杂网络中的属性贡献就不同。因此,挖掘复杂网络中的关键结点,具有巨大的实用价值。
其他文献
学位
推荐系统基于用户历史数据为用户提供个性化建议,是克服信息过载的一种有效手段。随着推荐系统的日益普及,推荐系统中数据的时序性、连续性、高速性和时变性等特点使数据满足流式性质,对传统的基于静态数据构造的推荐系统提出了巨大的挑战,而基于流式数据的推荐系统能够更加有效地处理流式性质的数据。基于矩阵分解的流式推荐算法不仅可以解决传统矩阵分解算法无法处理数据稀疏性的问题,并且能够解决数据流环境下的推荐问题。最
前体mRNA中内含子的精确识别和清除是真核生物中基因表达调控的重要机制之一。富含丝氨酸/精氨酸的蛋白(Serine/Arginine-rich proteins, SR protein)是真核生物中一类高度保
近年来,随着我国经济发展转型升级和城市化进程的加速,大量的工业企业搬迁入园,工业遗留场地成为城市土地流转的主力军。工业企业在长期的生产经营活动中,排放大量的放废水、
水稻是人类主要的粮食作物,并且是禾本科基因组研究的模式植物。亚洲栽培稻分为籼稻和粳稻两个亚种,他们之间的差异比较显著。粳稻日本晴的精细基因组测序早在2004年由IRGSP
本文主要介绍和回顾哈密顿系统的KAM和Nekhoroshev定理.从庞加莱在研究天体动力学提出的问题开始,到Kolmogorov和Arnol’d, Moser给出的经典的扰动定理,然后Nekhoroshev定理
学位
本文是译者在完成《文学地理学概论》英译任务基础上的一篇翻译实践报告。《文学地理学概论》是商务印书馆2017年出版的文学地理学研究的前沿学术专著,该书作者为国内知名学者、中国文学地理学学会会长曾大兴教授。译者所承担的翻译任务为该书的第一章“文学地理学的研究对象与学科定位”,原文汉语字数约为20000字,译文字数约为12000字。该章阐述了文学地理学的研究对象、学科定位、知识体系和研究意义等内容。本翻
Nekhoroshev稳定性理论是目前哈密顿动力系统研究领域最为重要的课题之一,它是俄国数学家N.N.Nekhoroshev(1946-2008)于20世纪70年代,继经典KAM理论之后,建立的一套研究哈密
随着我国经济的高速发展,人们对出行也提出了更高的要求,长期占据客运市场主导地位的公路客运已不能满足人们日益增长的出行需求。与此同时,高铁以安全、快捷和舒适的特性作为铁路现代化的标志应运而生。本文以昌吉赣高铁开通为背景,以区域运输通道内客运结构协同优化研究为主线,探讨旅客城际间的公共出行选择行为对通道内的客流分担率和客运结构协同优化的影响。首先,研究了运输通道基础理论,并简要分析了各客运方式的发展情