论文部分内容阅读
网络社区聚类是指通过聚类技术找到网络中团体内节点关联密切,团体间节点关联松散的结构,该问题的研究已经成为数据挖掘领域研究的一个热点,它与计算机科学中的图分割和图聚类有着密切的关系。通过聚类技术可以从网络社区中挖掘出隐藏的有价值的信息,目前网络社区聚类算法已广泛应用于科技、经济、商业、生物等各个领域。
本文在分析现有网络社区聚类算法研究现状基础上,提出了一种基于蚁群优化算法的网络社区聚类算法ANTCC(Ant Based Community Clustering)。ANTCC算法用节点间拥有的公共邻居数目来描述节点之间的距离以及在此之上定义了聚类内核心顶点,利用蚁群优化算法来搜索网络社区中的聚类,并且找出每个聚类中的核心顶点。蚁群优化算法中的每只蚂蚁根据概率转移函数产生一个解及用网络模块性Q来衡量找到的网络社区聚类质量;信息素局部和全局更新策略将蚂蚁的聚类结果评价反馈给信息素矩阵,使得并行工作的蚂蚁间能够更好的进行信息交流;蚁群优化算法的搜索策略是从较好的几个解中变异出新模式的解,避免局部最优。实验运行于合成数据集和基准数据集上,结果表明该算法相比现有的网络社区聚类算法具有较高的准确度,达到了网络社区聚类和核心节点发现的目的。