论文部分内容阅读
网络是一种呈现复杂系统的有效方法。复杂网络(complex network)描述了一系列的自然和社会系统,例如信息系统、生物系统、社会系统、交通系统、航空网络、电力系统以及一些合作性质的网络系统等。自然界中大量真的网络都具有其独特的结构特点,系统内部个元组之间的联系以及相互作用,可以抽象为具有一定组织关系的小型网络,这种小型网络承担着系统的功能,并且能够具体的体现网络中的组织关系特点。这些小型网络就定义为复杂网络的社区结构(community)。复杂网络中社区发现的研究可以揭示复杂网络结构特点和一些网络现象的成因。将复杂网络中的个体划分为不同的社区结构进行研究,可以有针对性的对复杂网络的某些特征进行研究,也可以减少对复杂网络某些特征研究的工作量。因此,复杂网络的社区发现方法的研究具有巨大的社会、经济和科研价值。本文针对复杂网络,首先,基于Louvain社区发现算法的启发,提出了基于社区相似的层次聚类社区发现算法(CSHC)。算法初始阶段将每一个结点作为一个社区,然后提出社区之间的相似性和模块度最大增益之间的一个合并系数,决定社区是否合并,迭代算法的停止条件为达到需要划分的社区个数k为止。CSHC算法分别在Karate ClubNetwork数据集和American College Football数据集上得到了很好的社区划分,其纯度与模块度对以往的社区发现算法都有一定的提高。并且CSHC算法可以在很少次的合并达到社区划分结果,与以往社区发现算法相比其效率大大增加。其次,本文提出了基于重要结点的社区发现算法(INC),首先依据模块度最大化理论,计算出网络的模块度矩阵B的最大k特征向量矩阵S。然后,提出聚类中心方法用于求出k个社团的重要结点作为k聚类中心。利用欧几里得距离计算每一个结点到k个聚类中心的距离,将结点分配到距离聚类中心最近的社区中。最后,对网络应用k-means方法进行迭代计算,最终得到k个社区的划分。INC算法分别在Karate Club Network数据集和American CollegeFootball数据集上得到了很好的社区划分,并且可以有效的发现潜在社区,其纯度与模块度对以往的社区发现算法都有一定的提高。并且INC算法可以在很少次的迭代达到社区划分结果,与以往社区发现算法相比其效率有很大提高。复杂网络内部的各个社区结构是复杂网络结构特征的具体承担者和复杂网络属性特征的具体体现者。另外,在系统内部,并不是所有的元组个体对复杂网络的特征和结构都起到一样的作用,一些元组会扮演更为重要角色,这种元组被称为网络中的关键结点。因此,本文提出了基于社区的重要结点评定方法,既充分的考虑到一个结点与其他所有结点之间的紧密程度,又充分考虑到结点在社区中的贡献,提出ICC算法对网络中结点进行重要性的评定。ICC算法分别在Karate Club Network数据集和AmericanCollege Football数据集进行实验验证,并与经典的中心性计算方法进行对比。实验结果表明,ICC算法很好的将社区中重要结点对网络的实际意义凸现出来,对网络中重要结点的评价有了新的视角,并且对网络的实际意义做出很好的评判。现代科学的网络为复杂网络的理解带来了重大的发展。复杂网络中社区发现与社区发现算法的研究对关键问题的讨论、集群的意义以及对真实网络的描述具有重要的意义。由于复杂网络中每个结点的重要程度不同,对复杂网络中的属性贡献就不同。因此,挖掘复杂网络中的关键结点,具有巨大的实用价值。