论文部分内容阅读
随着现代网络世界的快速普及,数据挖掘技术也越来越成熟。在此条件下,复杂网络成为了数据挖掘范畴内的热门研究课题。而复杂网络这一课题当中的热点话题之一就是社团检测,聚类分析是其探究的主要技术手段。对复杂网络中的社团结构进行分析可以协助研究人员更深刻地理解复杂网络的结构性能及其演化过程。论文中具体论述了复杂网络的网络模型、聚类分析的基本概念以及常见的社团检测算法。在对复杂网络中的结构和性能进行分析、研究之后,论文针对复杂网络节点特性提出了两个性能更优的社团检测算法,并将其成功地应用到图聚类中。(1)提出了一个基于节点邻近度的社团检测算法—CS-Cluster。该算法用于对带有语义信息的节点进行聚类检测。经过研究发现,大部分复杂网络中的社团检测算法都是在节点拓扑结构方面进行研究、分析而提出的,它们忽略了节点自身的语义特性,这就导致社团检测的结果不准确。基于此现象,论文提出了一个新的概念(节点邻近度)来完成节点间的相异度计算;引入关联度和匹配度的概念完成节点间结构相异度的计算;之后重新定义了初始聚类中心点的选取规则。该方法避免了人为判断带来的弊端,提高了聚类的精确性。最后,CS-Cluster算法使用K-Medoids算法框架完成社团划分,在两个数据集上进行实验,并表明CS-Cluster取得了较好的聚类效果。(2)提出了一个基于节点核心度的重叠社团检测算法—NCD算法。论文首先提出了节点核心度的概念;其次通过使用中心点可扩展原则,依据网络中节点之间能否可以构建三角模型的判定依据,对网络进行初步的重叠社团检测;最后在划分好的社团的基础上对重叠节点进行识别。论文将NCD算法应用在三个标准数据集上进行实验,使用NMI和模块度来对实验结果进行评价。实验结果表明NCD算法可以有效实现重叠社团的检测。