大规模网络重叠社区发现技术研究

来源 :中国人民解放军信息工程大学 解放军信息工程大学 | 被引量 : 0次 | 上传用户:zhuhai2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实世界的很多复杂系统(如社会网络、蛋白质交互网络、因特网等)都是由相互联系的实体组成的,自然地以网络的形式存在或者可以用网络来表示。社区结构刻画了网络中节点间关系的局部聚集特性,一般由性质相似或功能相近的网络节点组成。重叠社区发现问题研究已经成为一个研究热点。深入分析与研究网络中的重叠社区结构,对于理解复杂系统的组成规律、预测系统的组成节点及系统本身的行为有着重要意义。本文从网络社区结构分析、重叠社区发现方法研究和原型系统验证等方面,研究了大规模网络的重叠社区发现方法和技术。本文主要工作如下:  1.提出了一种采用邻居投票机制的重叠社区发现方法。该方法受到支持向量机分类方法思想的启发,假设不同社区之间的重叠部分主要由社区的边界节点组成。该方法将网络重叠社区发现分为两个阶段:第一阶段对网络进行非重叠社区发现;第二阶段对社区边界节点的社区隶属情况进行判别。为此设计了基于局部信息的邻居投票机制。该方法适用于大规模复杂网络,且无需预知网络中的社区个数等先验知识。采用此方法设计并实现了LM-NV(Louvain method with neighbor voting)重叠社区发现算法,该算法在第一阶段采用了LM非重叠社区发现算法。LM-NV算法的时间复杂度在最坏的情况下为O(m+nk),同网络中边的规模近似呈线性关系,具有良好的时间效率;在模拟网络数据和真实网络数据上的实验表明,该算法的社区发现准确度优于LFM,COPRA,LINK算法。  2.设计并实现了一种半监督的局部扩展式重叠社区发现算法SLEM(semi-supervised local expansion method)。该算法借鉴带约束的半监督聚类的思想,利用部分标注信息指导社区发现的过程,避免了非监督重叠社区发现算法的盲目性问题;采用基于网络节点度中心性的种子选取策略,能够得到局部性好、结构稳定的社区发现结果,解决了结果的抖动性问题;对社区发现结果的后处理,在保证高社区覆盖率的前提下尽量减少冗余的社区。在模拟网络数据和真实网络数据上的实验表明,对于稀疏程度不同的网络,综合考虑重叠模块度、社区连接密度和网络覆盖率三种指标,SLEM算法的社区发现结果优于NLEM,LFM,GCE算法的结果。  3.设计并实现了一个微博网络重叠社区发现原型系统。该系统通过分析节点信息和节点间连接关系,构建微博用户关系网络;采用LM-NV算法对网络进行重叠社区划分;将划分结果以可视化的方式进行交互展示,便于研究者直观地分析和研究网络社区结构。利用此系统构建了由新浪微博上机器学习、数据挖掘等领域用户形成的1489个节点、108064条边的用户关系网络,划分为5个重叠社区,并分析了各社区的属性和不同社区间的相关性。该结果验证了LM-NV算法的有效性,对关键人物挖掘和信息传播分析提供了支撑。
其他文献
SOPC (System On Programmable Chip,可编程片上系统)是一种灵活、高效的SOC解决方案,一种新的软硬件协同设计的系统设计技术。基于SOPC的嵌入式系统具有体积小、性能强、功
病历是医生综合应用医学理论的具体反映形式。通过研究病历,可以更好的学习医学理论。如果能用计算机的技术来处理这些病历,将会得到事半功倍的效果。而目前病历的自然语言性质难以满足计算机处理的需要。传统的解决方法是采用人工填充模板的方式来对病历信息进行结构化转换。这不仅耗时耗力,而且随着病历的不断的增多,再采用人工的方式将会变得越来越困难。因此自动化的病历信息转换问题具有重要的实际应用价值。本文从需求分析
随着时代的发展,计算机逐步融入到人们的生产生活中,作为计算机灵魂的软件其可信性问题成为威胁计算机安全的关键。软件的可信度量应运而生,软件可信度量的属性包括:可用性、可靠
随着芯片设计技术的不断发展,国内出现了多款自主设计的国产处理器。由于国产处理器采用非主流的指令集架构,国产处理器面临软件资源缺乏的问题。把X86处理器丰富的资源移植到
地理信息系统(GIS)就是一种利用计算机对有关地理、空间位置的数据信息进行存储、处理、查询和显示的计算机支持系统。GIS的发展始于60年代,90年代以来,随着互联网络的发展及
电信商旅平台是电子商务和电信企业信息系统相结合的产物.当前,转型成为了各电信运营商采取的应对世界经济和电信产业发展的形式变化的强有力措施.号码百事通作为中国电信的
AdHoc网络是一种节点可任意移动的具有高度动态拓扑结构的自组织网络,也被称为“移动多跳网络”。网络中每个节点兼备路由器和主机两种功能,网络拓扑结构的动态变化特征使得
燃料结算管理是电厂燃料管理的一个重要组成部分。电厂燃料结算快速、准确、灵活简单是提高结算效率,加快资金周转的重要保证。并且对于保证电厂安全供煤,提高发电经济效益有
随着我国物流行业的市场细分,物流企业中物流车辆的总拥有量呈快速增长的态势,对货物储运管理系统的功能、性能、扩展性、灵活性、安全性以及先进性上提出了更高的要求,传统
视觉感知是人类的主要信息源,人类感知外界信息的80%来自视觉。使计算机能像人那样通过视觉来观察和理解世界,并具有自主适应环境的能力,是人类多年以来的梦想。但是,当前视觉