基于随机游走的复杂网络聚类算法研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户：bosslon

【摘要】

：

现实世界中存在诸多复杂网络,如生物网、科技网和社交网等。近年来复杂网络的研究吸引了来自计算机、物理、数学和生物等众多领域的研究者,已成为多学科交叉研究的热点之一。

【作者】

：

汪帮菊

【机构】

：

安徽大学

【出处】

：

安徽大学

【发表日期】

：

2016年期

【关键词】

：

网络聚类社团结构随机游走局部社团符号网络

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

现实世界中存在诸多复杂网络,如生物网、科技网和社交网等。近年来复杂网络的研究吸引了来自计算机、物理、数学和生物等众多领域的研究者,已成为多学科交叉研究的热点之一。复杂网络聚类旨在揭示出复杂网络中真实存在的网络社团结构,主要包括对无符号网络、符号网络、有权网络和有向网络等不同类型的复杂网络进行社团结构检测。复杂网络之所以在当前的研究课题中具有如此重要的社会价值和应用价值,是因为对复杂网络的聚类分析,在对预测复杂网络的网络行为、分析网络拓扑结构和挖掘网络潜在功能方面起到积极作用。本文分别针对无符号网络和符号网络的社团结构检测问题进行了研究,提出了基于随机游走算法的社团结构检测方法。本文的主要研究工作如下：(1)在无符号网络中,根据社团结构是否明显,可以将社团分为强社团和弱社团等多种类型。现有的社团结构检测算法在挖掘强社团结构时,可以表现出优异的性能,在挖掘弱社团结构时,算法性能仍存在略微不足。本文基于假设---社团中的点游走到社团内其他点的概率大于游走到社团外点的概率,提出一种利用随机游走算法检测社团结构的方法。该方法从全局网络出发找到局部最大度节点,根据该局部最大度节点找到局部最小完全子图视为局部社团,并将网络中节点根据是否在局部社团中分为聚类节点以及未聚类节点。进而,利用基于随机游走的条件概率模型,计算未聚类节点属于每个社团的概率,并将该未聚类节点加入其最可能归属的社团。最后,对己聚类社团进行优化。在随机网络和真实网络上,利用NMI值和F1值作为算法性能衡量指标,对算法性能进行评估,并与经典的网络聚类算法进行了比较。实验结果表明该算法能够较好地检测出网络社团结构,尤其在检测弱社团结构方面,大大的提高了检测精度,相比其他社团结构检测算法具有明显优势。(2)在符号网络中,边既包括表示“友好、联盟”等关系的正向边,又包括表示“敌视、竞争””等关系的负向边。现有的部分符号网络社团结构检测算法由于未充分利用网络的负边信息,导致对社团的检测精度存在一定的影响。针对上述问题,本文提出一种基于网络中的正负边信息,利用随机游走模型,检测符号网络中社团结构的方法。该方法将网络中每个节点的正度和负度的绝对值之和加起来作为该节点的度。根据节点的度找到局部最小社团,以网络中节点是否在局部社团内,将节点分为聚类节点以及未聚类节点。利用随机游走算法计算出每个未聚类节点加入局部社团的正概率和负概率。通过比较正概率与负概率的大小来判断该未聚类节点是否加入局部社团或是否由该未聚类节点动态挖掘一个新的局部社团。利用社团优化方法对聚类社团进行优化,形成最终的网络划分结果。本文所提方法充分利用了符号网络中负边的信息,保证了算法的稳定性。在真实符号网络和随机符号网络上验证了本文所提方法的可行性和有效性。同时,与其他符号网络社团结构检测算法相比,该算法检测精度更高。

其他文献

Flash存储系统数据管理算法的研究

基于半导体的以Flash为存储介质的存储器是一种高性能、低能耗的新兴存储设备,它的问世将逐渐取代以磁记录方式存储数据的硬盘。但由于Flash存储芯片本身容量的限制和芯片中

学位

Flash存储系统管理机制垃圾回收磨损均衡

可快速撤销的群签名方案研究与设计

随着计算机和网络技术的飞速发展,日益普及的互联网为我们提供了大量的经济利益和生活便利的同时,也带来了大量的信息安全问题,如个人隐私信息、商业与军事机密信息的泄露、

学位

群签名成员撤销子集覆盖框架联合攻击非关联性

基于平面图的网页分块算法的研究

随着网页结构的复杂化与内容的多主题化,搜索引擎的结果越来越无法满足人们的需求,因为网页作为最基本的信息获取单位已不再合适,要更准确的获取web上的信息,就必须对网页进

学位

网页分块HTML DOM树Gomory-Hu算法平面图

关联规则挖掘算法研究与应用

数据挖掘是指从大量的、不完全地、有噪声的、模糊的、随机的数据中提取人们感兴趣的知识和规则的过程，数据挖掘的研究已经取得了重大的进展，而且被应用到众多的领域。关联规则

学位

数据挖掘关联规则最大频繁项集最大关联规则隐含负规则

虚拟机动态迁移性能研究

随着近年来云服务的普及,用户体验变得极为重要,针对负载均衡和热点等问题,需要依靠虚拟机动态迁移技术来解决问题的同时,保证用户的体验。虚拟机动态迁移流程中,内存由于信

学位

虚拟机动态迁移页内脏数据算术编码多线程

H.248协议在中继网关的设计与实现

随着因特网(Internet)的普及和IP技术、VoIP技术的发展,VoIP产品在电信市场中占有的份额的不断提高,VoIP技术已经成为计算机业和电信业最热门的话题之一。H.248协议具有简单

学位

VOIPH.248中继网关软交换

智能预测土建工程概算方法的研究及其应用

随着数据库技术的逐渐成熟和信息数据的膨胀,数据挖掘技术(Data Mining,DM)应运而生,被广泛应用于银行金融、气象预报、DNA、教育、电信、客户分类等领域及国防科研上。数据

学位

数据挖掘土建工程概算系统RBF神经网络相关分析K-Means聚类算法

基于时空彩色编码的稳定健三维视觉方法研究

在计算机视觉领域，从二维图像重建物体三维轮廓形状是当前的一个研究热点，高质量的3D模型成为现代人们生活的迫切需求，广泛应用于逆向工程。传统的三维数据获取方法，如双目立体视

学位

编码结构光技术系统标定三维计算彩色编码三维视觉方法

基于聚类与分类结合的多示例预测算法研究

多示例学习的主要目的是通过学习训练集中的概念,为一些不可预知的包获取正确的类别标签。目前大量学者对多示例学习的理论及应用进行了研究,并取得了丰富的成果,然而多数研

学位

多示例学习训练包k-均值算法支持向量机Hausdorff 距离

特征提取技术在人脸识别中的研究与应用

人脸识别是人工智能与模式识别领域以及计算机视觉领域最富挑战性的研究课题之一。在计算机科学领域的许多科学家都希望机器能够具有人类的智慧,并且能够像人类一样识别和记

学位

人脸识别特征提取主成分分析(PCA)线性判别分析(LDA)最大间距准则(MMC)局部保持(LPP)

基于随机游走的复杂网络聚类算法研究

与本文相关的学术论文