基于大规模复杂网络的重叠社团检测算法研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:dyq135621
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,由于社交网络的发展和大数据时代的兴起,大规模复杂网络社团检测已成为研究热点之一。社团检测作为复杂网络研究中一项基础而又重要的工作,旨在挖掘网络中一组节点集合,这些集合内部的节点连接紧密,而集合之间的节点连接稀疏。然而在现实世界网络中经常存在一些节点可能会同时属于多个社团的情况,即重叠社团结构。因此,对重叠社团结构的检测更加重要且具有应用价值。随着网络科学的不断发展,许多复杂网络的规模甚至包含数百万数量的节点和数十亿条边。对如此大规模的复杂网络进行重叠社团挖掘一直是该领域内的难点之一。基于此,本文对大规模复杂网络重叠社团检测问题进行了深入研究,提出了一种基于弱团渗流思想的重叠社团检测算法。此外,为了解决数百万数量级的超大规模复杂网络重叠社团检测问题,本文还提出一种基于局部邻居信息的快速重叠社团检测算法。这两种算法均是以检测大规模复杂网络重叠社团结构为目的,相比较其他重叠社团检测算法,本文所提算法计算效率更快,社团检测精度更高。本文的主要研究工作如下:(1)本文提出了一种基于弱团渗流的重叠社团检测算法。k-团渗流方法是当前最常用的重叠社团检测算法之一,其基本思想是将社团结构定义为由一系列共享很多节点的完全连通子图组成。k-团渗流方法需要检测网络中所有k-团(即,k-clique),然而k-团的检测是NP完全问题,因此基于k-团渗流方法的时间复杂度很高。为了提高重叠社团检测算法在大规模复杂网络上检测重叠社团的效率和准确性,本文利用网络中的局部拓扑信息快速挖掘网络中的弱团。本文将弱团定义为由网络中两个关键节点及其公共邻居组合而成,由于仅仅利用节点的邻居信息,因此检测弱团要比检测k-团高效很多。同时在渗流过程中,提出新的相似度指标来衡量两个弱团之间的相似性,并以此来判断两个弱团是否应该合并,以提升算法的准确性。在新的相似度指标中不仅考虑了两个弱团之间共享的节点数目还统计了弱团之间边的连接数目。在LFR基准数据集和真实网络数据集上的实验结果表明,与现有几种重叠社团检测算法相比,基于弱团渗流的重叠社团检测算法在计算效率和发现重叠社团质量方面都具有明显优势。(2)本文提出一种基于局部邻居信息的快速重叠社团检测算法。随着社交网络的兴起和互联网时代的发展,目前复杂网络的规模变得越来越巨大。为了能够在数百万数量级这种超大规模复杂网络中检测重叠社团结构,本文提出了一种基于局部邻居信息的快速重叠社团检测算法,称之为OCLN(Overlapping Community detection by using Local-Neighborhood information)算法。OCLN 算法的基本思想在于首先利用网络中节点的内部度数和外部度数这些局部结构快速扩充社团,随后根据社团中每个节点的局部邻居信息在该社团中的贡献度计算节点的隶属度指标。从社团中删除掉一些隶属度较低的节点,提高算法的准确性。由于整个算法全部利用网络的局部结构,因此OCLN算法的时间复杂度为线性,即O(n+m),n为网络中节点的数目,m为边的数目。通过对LFR基准网络和大规模真实网络上的实验分析表明,OCLN算法在算法运行时间和NMI精度性能上都明显优于其他几种重叠社团检测算法。
其他文献
作为企业的灵魂,企业文化对企业发展的作用至关重要。企业文化虽然具有相对稳定性,但随着企业的自身成长和外部经营环境的变化,在一定的历史时期企业需要根据自身的具体问题进行
玉米丝黑穗病广泛分布于我国各玉米产区,每年都有不同程度的发生。一般年份发病率在2%~8%,个别重病地块可达60%~70%。病穗全部为黑粉,造成损失很大。一、症状病株果穗有的不吐
4月7-12日,第三届广东国际印刷展览会(Print China 2015)在东莞厚街广东现代国际展览中心举行。在本次展会上,国内极富盛誉的老牌胶印机制造厂商——江苏昌昇集团股份有限公司(
军事训练是对军事科学理论及作战技能学习和教练的一项重要活动,是现代军队作战人员提升素质和战斗力的重要手段之一,传统的军事训练教学方式以统训、统练结合为主。随着现代
2020年8月14~16日,第八届中国电子信息博览会(下称“电博会”)在深圳举办。按照電博会改革方案,本届由赛艾特会展(深圳)有限公司主办,中国电子器材有限公司、深圳市平板显示行业协会承办。电博会以“创新共享,开放合作”为主题,展出面积近10万平方米,吸引了海内外知名企业、研究机构和行业组织1 282家参展。电博会共设主题馆、新型显示馆、智能制造馆、机器人与智能系统馆、大数据存储馆、智能新能源汽车
【正】在当前低迷的国内印机市场,或许正需要一个视角独特的"圈外人"为印机行业注入新鲜血液。徐嘉就是这样一个"圈外人",在他加入海贺集团之后,也的确不负众望,带领海贺集团
针对目前国内轮式自主格斗类的机器人赛场格斗性能较差,灵活性和攻击性不兼具,设备性能不可靠的问题,本文设计并完成了一种基于STM32的轮式自主格斗机器人。能实现自主交互对
《东南传播》从2013年4月起至今连续刊登该刊学术顾问陈力丹教授撰写的马列主义新闻观系列论文受到国内传播学界和业界广泛关注,陆续入选2014年中国人民大学科研处编写的《基
全球市场研究机构IDC近日发布的研究报告显示,2013年第二季度全球大幅面打印机销量约为73000台,与去年同期相比下降4.2%,销售额下降了3.2%,与去年同期相比减少7.81亿美元。ID
期刊
通过小森SM系列转轮机可实现一些防伪效果的印刷,为保证高品质的防伪效果,对轮转机的使用要求非常高,其中印刷压力的调整是重中之重。下面,笔者结合生产实践,分析轮转机印刷