基于标签影响值的重叠社区发现算法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:wcj_lp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的不断发展,复杂的网络社区结构越来越多的被学术界关注,社区发现的相关技术已经成为了当下分析网络社区的重点。因此,社区发现的深入理论研究对于社区网络结构和社区网络特征有着极其深远的意义和目的。目前,社区发现算法的划分主要分为两个方面,一个是非重叠的社区发现算法,另外一个就是重叠的社区发现算法。但是现实情况不像想象的那么简单,它是一个复杂的网络结构,即复杂网络中的单个节点极大可能存在于多个社区网络环境中。因此,本文对重叠社区发现算法的研究,无论从理论依据还是现实情况都有重大的意义。传统的标签传播的社区发现算法是LPA算法,它单独使用网络结构来指导其过程,既不需要任何参数,也不需要优化目标函数。它从每个节点具有不同标签的配置开始,在每个步骤中,一个节点(异步版本)或每个节点(同步版本)都自行决定将其标签更改为最大数量的邻居所携带的标签。若标签有多个,则随机选择其中一个作为标签。通过构建算法函数,随着其不断的迭代和函数的渐渐收敛,每个节点在自己的社区中拥有的邻居数量要多于其他社区中的邻居。更重要的是,它是重叠社区发现算法SLPA和COPRA的基础算法,两个算法都是在此基础之上拓展出的社区发现算法。目前常见的重叠社区发现算法包括派系过滤CPM算法,SLPA和COPRA等。而SLPA和COPRA都是基于标签传播算法LPA改进形成的新算法,它们相比于CPM算法无论是效率和复杂程度上都要更优一些,从而在社区发现的领域内被广泛的应用与研究。其中COPRA算法可以有效的挖掘出重叠社区网络,但是该算法随机性强,鲁棒性差,社区划分的结果极其不稳定。针对上述社区发现算法COPRA所带来的问题,本文提出了基于标签影响值的重叠社区发现算法,主要思想仍是以COPRA算法作为相关基础,在该算法的基础之上提出了标签影响值的概念。由于COPRA算法在标签初始化阶段所带来的效率低,稳定性较差,标签选择阶段所带来的随机性强的问题,本文首先针对效率低,稳定性差的问题提出了一种三角形的标签初始化方法,该方法保证了初始化阶段更新标签的时间复杂度降低,同时资源消耗也较小。然后针对随机强的问题,本文提出了一种标签影响值的概念,该方法从三个方面考虑了标签的选择问题,不会像COPRA那样稳定性得不到保障,从而在此基础之上提出了Label_Inf(l)这一方法。和COPRA算法相对比,本文提出的Label_Inf(l)虽然耗费的时间较长,但是有利的一面是该算法和原有COPRA算法相比,稳定性得到了很大的提高,从而保证在追求稳定性的时候可以划分出优质社区。为了验证Label_Inf(l)的计算准确性,选用了两个基准数据集Zachary karate club和American College football以及一个人工合成网络数据集对本文提出的算法进行测试评估。通过在两个基准数据集上进行重叠社区发现算法COPRA与本文算法对比,本文提出的算法由于在标签初始化阶段和标签选择阶段进行了改进,虽然时间复杂度有所提高,但是模块度Q也有所提高,这就说明了本文提出的算法在社区划分上稳定性提高了,增强了准确率。而使用人工合成网络数据集在SLPA,COPRA和本文算法上进行对比,发现本文算法的NMI值的下降幅度比SLPA和COPRA要少,这间接说明了本文算法在社区网络复杂的情况下,依然可以划分出较优质的社区。
其他文献
现如今,人们的绿色可持续的意识逐渐增强。在现实的产业链实践中,产品绿色设计努力的概念逐渐被企业使用。企业为了实现战略性目标,追求环保的产品设计理念具有着深远的意义,
为了稳定泰国的汇率和价格水平,我们尝试探究其国内通货膨胀和汇率水平如何应对冲击。我们开发了向量自回归模型的多变量系统方程进行分析,该系统方程同时也可以捕获泰国的短
在我国目前高速城镇化进程下的乡村变革中,传统村落研究也愈来愈受到关注。传统村落的保护与传承也成为诸多学者专家研究的热点,同时传统村落的乡村景观作为人居环境的重要组成部分,也与传统村落的特色文化、自然环境、乡愁记忆等有着密切联系。在以往乡村景观研究中主要聚焦于村落物质空间形态且多以测绘、遥感等研究方法为核心,而从集体记忆这种以人为本的角度出发的研究方法颇为偏少。集体记忆作为一种由外部因素与记忆因素共
生物表面活性剂(Biosurfactants)是微生物在代谢过程中分泌的集亲水基和憎水基于一体的两性化合物。近年来,研究者发现,一些微生物在摄取疏水性物质的过程中为了适应周围环境
数字经济时代资本主义劳动过程的新特点主要体现在:社会总体劳动资料的作用强化和单个劳动者活劳动的作用弱化并存,远程式、散点式、移动式的数字劳动使得劳动和闲暇的边界越
氰化物是一种剧毒物质。设计合成出能够检测CN~-并且具有高选择性、高灵敏度的荧光探针具有十分重要的意义。目前用于检测CN~-的荧光探针荧光大多处于蓝光至黄光范围,发红光
变电站作为电能传输的重要枢纽,其安全性和可靠性及其重要。由于变电站的室内环境复杂,特别是狭小空间内的设备分布不规则,使机器人巡检技术的应用受到很大限制。因此开展复杂环境下轨道机器人的研究具有重要意义。本文在阐述国内外巡检机器人研究现状的基础上,根据变电站室内空间狭窄、设备布置复杂的工作环境,研制一种小转弯能变轨运行的变电站室内轨道巡检机器人。通过轨道转弯半径和工作路径进行优化,该机器人转弯半径可以
森林郁闭度是森林资源监测的一个重要基础参数,在森林资源管理中具有重要作用。以往遥感反演森林郁闭度均基于单一遥感数据源,结合光学与雷达卫星数据的遥感估测模型构建与应用研究较少,而结合国产光学与雷达卫星数据估测森林郁闭度的相关研究还未见报道。因而,本文选择天山西部云杉林区为实验区,以天山云杉小班郁闭度遥感定量估测为目标,基于国产光学和雷达卫星数据,提取遥感影像特征样本,探究基于小班尺度的多元逐步回归、
企业的发展战略在企业运行过程中得到积极的推进是一个企业发展的重要标志,与此同时建立一个与企业战略相匹配的绩效考核体系更是对企业发展起到至关重要的作用,我们常说企业
单核细胞增生李斯特菌(Listeria monocytogenes,以下简称Lm)是一种革兰氏阳性、无芽孢的短杆菌,能通过食用污染的食物,引起人畜共患的李斯特菌病,是威胁人类健康的主要食源性致病菌之一。GlnR是一种全局性转录调控蛋白,参与调控众多氮代谢相关基因,在氮代谢调控过程中具有重要作用。GlnA是谷氨酰胺合成酶,由glnA编码。在2型猪链球菌和沙门氏菌等细菌中,GInA不仅参与谷氨酰胺代谢