【摘 要】
:
随着社交网络的不断发展,社区发现已经成为复杂网络领域的一个重要的研究热点。若干个社区组成了一个完整的网络,在社区的内部,节点之间的连接相对紧密,而社区与社区之间节点
论文部分内容阅读
随着社交网络的不断发展,社区发现已经成为复杂网络领域的一个重要的研究热点。若干个社区组成了一个完整的网络,在社区的内部,节点之间的连接相对紧密,而社区与社区之间节点间的连接则相对松散。标签传播算法LPA(Label Propagation Algorithm)是社区发现算法中比较优秀的算法。它的线性的时间复杂度是它的一大优势。虽然LPA有很多的优点,但是缺点也是非常明显的。由于标签的随机选择,LPA不能保证每次结果的一致性;此外,在多次迭代之后,可能会出现大的社区将小社区吞并的现象。结合以上内容,本文在LPA的基础上改进扩展出了两个算法,具体的研究成果如下所示:(1)LPA的优化改进LPA算法不包含任何参数,主要对标签传播及更新进行优化。在基于概率和相似度的标签传播算法 PSLPA(Probability and Similarity based Label Propagation Algorithm)中,结合节点间的概率以及相似度,并在标签传播的过程中使用了自适应标签选择的方式对节点标签进行更新。在基于节点权重和随机游走的标签传播算法WRWILPA(Weightand Random Walk based Label Propagation Algorithm)中,结合节点权重和随机游走提出了一种新的相似度计算方式,在标签传播过程中利用权重和相似度进行标签的更新。这两个算法在准确性以及稳定性上都有着很优秀的表现。(2)并行化对于上述的两个算法均实现了并行化。采用的是Spark平台下的GraphX模块。将算法流程转化为对网络图的迭代计算过程,通过现有的API接口对网络图进行转换操作。对于标签传播过程,实现了自定义的函数,来完成算法的并行化。并行化后的算法在不同规模的数据集上均表现出了高准确性以及高稳定性。
其他文献
随着复杂网络研究的发展,人们逐渐开始关注网络结构复杂性以及其与网络行为之间的关系。为了更好地理解网络结构和网络行为之间的关系,就需要详细了解网络所具备的特性。复杂
随着互联网技术的进步,数据挖掘这一学术领域正在日益发展,离群点检测作为其重要组成部分之一,目的是找出异常的数据信息。迄今为止,离群点检测的相关技术已经在网络安全、社
关于对神经网络分岔行为的研究一直以来都是十分热门的话题,也是在神经网络动力学行为研究中的一大重点和难点。而时滞反应-扩散神经网络作为普通神经网络的扩展,由于其更符合现实生物神经网络的特点、存在更加丰富的动力学行为、更加适用于工业发展与应用而逐渐成为学者们的重点研究领域。本文分别研究了时滞中立型反应-扩散神经元模型的Hopf分岔和二维反应-扩散神经网络的Hopf分岔及图灵不稳定性,本文的主要内容和创
瘿蚜是能够刺激植物组织增生并形成虫瘿的一类蚜虫,是致瘿昆虫的重要类群。瘿蚜大部分是农林害虫,但也有一些种类对寄主植物没有明显为害,如五倍子蚜虫。沃尔巴克氏体Wolbach
当前以社交网络为代表的复杂网络规模庞大且充满活力,如Twitter的日活跃用户数量超过为1.34亿,Snapchat的日活用户数超2亿,Facebook的月活用户突破20亿。这些海量数据构成了
禾本科,也称作牧草家族,是一个开花的单子叶植物种类。家族成员包括主要的粮食作物、为食草动物提供食物的牧草以及具有陆生生物环境多样性的植被。因此,禾本科是研究物种多
我国土壤盐渍化愈来愈严重,其主要分布的位置在华北、西北及沿海地区,最突出的是宁夏地区。本文以宁夏石嘴山市惠农区燕子墩乡为例,分析该区域降雨蒸发前后,水盐运移的动态变
目的:①比较所有研究对象及各组间CAP与PAP的关系;及其在新疆维吾尔族、汉族中所有研究对象及各组间是否有差别。②探讨尿微量蛋白与CAP及PAP的关系,及其在维族、汉族间的差
堆石料是土木、水利等工程建设中普遍使用的材料,受颗粒破碎及排列、级配、石料成因、渗透性等因素影响,其强度与变形特性描述非常复杂。堆石料的强度变形特征,不仅受其宏观
近年来计算机的计算能力不断提高,卷积网络被广泛的应用到图像处理任务之中,计算机视觉领域中各项视觉任务的检测性能得到了提高。目标检测任务是计算机视觉领域的重要任务之