论文部分内容阅读
随着计算机技术的迅猛发展,收集并处理规模庞大且种类繁多的实际网络数据成为满足物质与文化需求的必要途径,网络科学也随之扮演着愈来愈重要的角色。与人们生活紧密相关的网络,如社会网,生物网,信息网,交通运输网等,这些网络之间相互交错关联。揭示网络中共性的问题以及解决这些问题的普适方法便成为了网络研究的一个重点,而这些网络可以归纳于复杂网络的范畴。挖掘出其中隐藏的社团结构,对病毒传播的预防、舆情的控制、以及未知生物功能的预测均起到至关重要的作用。本文针对复杂网络中社团结构的挖掘所做工作如下:(1)综述了复杂网络的研究现状、相关定义、性质及模型,分析了社团结构的层次划分,叙述了研究社团结构的意义,总结了典型的社团结构划分算法的优缺点,论述了利用聚类的算法思想以及自组织竞争神经网络(简称SOM)的相关知识对社团结构进行挖掘。(2)提出了基于最短路径特征的社团挖掘算法(Community Discovery Algorithm Based on Shortest Path Feature,SPCDA)。基于最短路径的特征,由其数目的特征计算每个节点的中介系数从而获取社团中心,据其长度的特征计算节点之间的相似度值。约定一种阈值作为划分规则,该阈值最终由所有节点的平均相似度值确定。如此以来构成类似于聚类的模型,最后按照划分规则将每个节点(不包括社团中心的节点)分别与阈值进行比较,取超过阈值的节点划分聚类,据此过程不断迭代,直至划分完成。将该算法应用于经典的复杂网络实验仿真平台,并与典型的GN算法和LPA算法进行比较分析,结果证实SPCDA算法能够快速、准确的挖掘隐藏的社团结构。(3)提出了基于自组织竞争神经网络的多特征社团挖掘算法(Multi-Feature Community Discovery Algorithm Based on Self-Organizing Competitive Neural Network,SOMCD A)。考虑网络的拓扑结构兼顾节点特征属性,将聚类思想与SOM相结合。提出的算法基于节点的影响力,结合节点的度及其相邻节点之间的连接边数来计算每个节点的凝聚系数,从凝聚系数值较大的节点中提取出特征节点,并将这些有代表性的特征节点作为样本节点。然后针对样本节点的多特征属性信息用SOM对其进行训练,再将非样本节点提供给经过训练的SOM。依据SOM的结构存储模式的特征,竞争网络就会做出识别,从而实现社团划分的目的。最后根据每次仿真所取的竞争层神经元个数的不同,采用模块度函数来确定最佳社团结构。