论文部分内容阅读
在复杂网络分析中,社区发现是该领域的重要课题。如何快速有效地将复杂网络中的社区挖掘出来呈现给数据的使用者越来越受到研究者的重视。本文基于谱图理论中的代数连通性函数给出三个复杂网络社区发现模型。 第一个是基于代数连通性的谱优化复杂网络社区发现模型。在复杂网络社区发现模型当中,Newman与Girvan的GN模型受到了领域内的广泛关注,但其时间复杂度高。在此基础上,基于代数连通性函数给出了一种合理的解决办法。代数连通性函数可用于测量网络的连通程度。为改善社区发现算法的时间复杂度,模型基于代数连通性提出了一种谱优化模型。该凸优化问题可由半正定规划求全局最优解,但其时间复杂度较高。模型采用贪婪策略优化方法,通过最小化网络连通性函数在候选边集中选择删除的边集。使该模型应用于中等规模网络中。 第二个是基于代数连通性的快速复杂网络社区发现模型。随着互联网中虚拟社会网络的发展,处理大规模网络越来越受到人们的重视。Newman等人基于随机游走,最短路径和总有效阻抗提出了边中心性(Edgebetweenness)的概念。本模型首次基于代数连通性函数提出边中心性测度,有效降低该测度计算的时间复杂度,从而设计出线性的复杂网络社区发现算法。当社区混合度不高时,模型准确地识别社区,但当社区混合度升高时算法准确度下降较快。 第三个是基于代数连通性的自动标注社会网络社区发现模型,本模型分为分割步骤和标注步骤。本模型根据社会网络的节点特性将中心节点删除,有效降低社区间的混合程度,同时由于社区内的庞大节点集,社区依然紧密地聚集在一起。分割步骤结束后,根据已标注节点信息去标注未标注节点,并更新已标注节点,得到社区结果。 本文采用常用的LRFbenchmark生成的虚拟复杂网络和真实网络对本文提到的模型进行评价。结果表明基于代数连通性的谱优化复杂网络社区发现模型有效降低了GN算法的迭代次数,一定程度上降低其时间复杂度,并有效保持其分割效果。基于代数连通性的快速复杂网络社区发现模型是当今最快的社区发现模型之一,在社区混合度不高的复杂网络中准确率高于同类快速社区发现模型。这三个模型在真实的复杂网络中均显示出较好的性能。