基于局部拓展的重叠社区发现算法研究及其并行化

来源 :湖南大学 | 被引量 : 0次 | 上传用户:lck2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络规模的不断增长,如何在规模较大的网络中去发现复杂网络的重叠社区结构成为了近年来的研究热点。历年来研究者们提出了许多经典的重叠社区发现算法,基于局部拓展优化的重叠社区发现算法是其中的一类典型方法,它主要分为两个阶段:种子选择阶段和局部扩展阶段,但该类算法还存在着算法社区划分质量不够高,只适用于小规模社团发现的问题。为此本文将针对重叠社区划分质量不高的问题进行研究和改进,同时为了提高算法的效率,研究算法的并行化处理及分布式并行实现,本文的主要工作如下:(1)针对当前局部拓展重叠社区方法没有充分考虑节点的重要性和相似性从而导致社区划分质量不高的问题,本文提出了一种基于点权和边权的局部扩展重叠社区发现算法(ROCDNWS),该算法综合考虑网络节点的全局信息和局部信息来衡量节点的重要性,同时考虑基于边权的节点相似性,提出了一种新的种子集选择方法,利用节点重要性和相似性计算邻居节点与核心节点的适应度值,选择使初始局部社区质量函数最优的邻居节点作为种子集,并通过种子集进行拓展,每次选择与社区适应性最高的邻居节点形成初始社区,最后通过社区的优化合并得到最终的重叠社区。实验结果表明,与其它的经典重叠社区发现算法相比,本文提出的ROCDNWS算法在重叠社区检测质量及算法的准确性都有良好的表现。(2)针对上述算法存在时间效率不高的问题,本文基于Spark GraphX并行化计算框架,提出了一种并行重叠社区发现算法PROCDNWS,该算法在ROCDNWS算法的基础上,先通过点权和边权的并行化处理之后得到了 dightWightRDD(点权值)和edgeWightRDD(边权值),然后根据这两个值选择核心节点及其适应度最大的前K个邻居来构建初始种子集seedsRDD,算法使用广播机制将节点和边信息发送到各个集群来完成种子集的并行社区扩展,最后在各个partition上完成社区的合并。并行化算法通过构建Spark分布式集群环境来完成相关实验,结果表明:将ROCDNWS算法进行Spark并行化操作是可行的,可以进一步提升算法的效率。
其他文献
随着汽车轻量化技术的快速发展,现代车身轻量化材料朝着多种材料混合使用的趋势发展。车身轻量化材料连接技术应用广泛,不同轻量化材料之间的连接性能备受关注,尤其是在新型轻量化材料碳纤维增强复合材料(CFRP)和传统轻量化材料铝合金之间,其连接的机理机制受到了学者们的广泛研究。目前,众多学者对于单一连接方式和混合连接方式的接头开展了许多力学性能实验的研究,但是对于不同连接技术之间的异种材料单搭接接头的连接
随着现代城市和交通网络地大力发展,高陡边坡的数量和规模也愈加增多,而高陡边坡是滑坡、泥石流、崩塌等地质灾害的主要发生地,危及了人民的财产和安全,因此对于高陡边坡的勘测和监测十分必要。为克服传统勘察手段的效率低、危险性高等弊端,本文提出了基于无人机贴近摄影技术的高陡边坡勘测方法,并提出了以Knn算法与PCA主成分分析法为主要结构的结构面半自动识别与提取算法,以此算法识别了结构面中蕴含的结构面产状信息
随着“以人为本”“用户驱动”等理念的盛行,设计逐步由造物活动转向了解决复杂关系的活动,设计的服务对象也由单人扩大为社会群体。在此历史背景下诞生的参与式设计,顺应了时代发展的潮流,被认为是一项能够有效推动项目发展的设计活动。参与式设计如今已应用于诸多设计领域,但国内的研究更多的是将参与式设计作为一种推动项目进展的工具,对于通过参与式设计为参与者赋能的研究相对较少。将参与式设计应用于参与者的能力建设,
水稻、小麦和玉米等禾谷类作物在成熟收获前如碰到持续高温多雨的天气往往会出现穗上发芽的现象,常将这种现象称为穗萌。我国地域辽阔,水稻种植和生产面积广泛,由于穗萌现象常导致萌发后的种子失去食用价值、种用价值和贮藏价值,通常作为饲料等利用,造成巨大的经济损失。本研究首先验证了大麦糊粉层特异启动子Amy32b在水稻中的表达情况,同时将Amy32b启动子TATA-box周围锚定上Tet O操纵序列进行修饰改
供应链金融的发展已经成为中小企业的新型融资渠道,银行通过对供应链的整体授信,切实有效地在一定程度上缓解中小企业融资难问题。面对互联网行业的不断发展,传统行业与互联网相结合产生各种经营模式。传统供应链金融引入互联网,产生多种形式的线上供应链金融,其中一种便是基于电商平台的供应链金融(Online Supply Chain Finance)。在互联网金融参与的背景下,线上供应链金融较传统供应链金融的参
重金属对湖泊生态环境的危害与其迁移密不可分,重金属在湖泊水体及沉积物中的迁移行为已被广泛研究,而重金属在沉积物悬浮液中迁移机制的研究相对缺乏。此外,部分湖泊受重金属污染与湖泊富营养化双重危害,湖泊富营养化通常归因于高浓度磷酸盐且伴随着高浓度的溶解性有机质(DOM),二者均可对湖泊中重金属的迁移产生较大的影响。因此,为探究磷酸盐和DOM对沉积物悬浮液中重金属迁移的影响,首先通过沉积物悬浮液模拟试验分
锆合金具有优异的核性能而被广泛应用于核燃料组件,而核燃料组件包括许多不同结构类型的特种格架,其由锆合金冲制而成的内、外条带组成。锆合金冲制过程面临的主要问题是提升带材的塑性变形能力,另外,堆内辐照生长环境引起格架条带伸长和弹簧应力松弛,导致定位格架对燃料棒的夹持力减少,需要减弱冲制前带材的各向异性,因此,调控冲制前带材的显微组织,降低带材各向异性系数,探明影响带材冲制的显微组织以便于生产调控,显得
伴随着当今社会的全面快速发展,人们对电力系统供电可靠性的要求日益提升。其中,状态估计是电网调控过程中最为关键的一环。然而,随着智能电网与信息物理网络的深度融合,状态估计所需的电力量测信息极易遭受网络攻击的威胁,难以确保其数据精度。通信网络的脆弱性为供电系统的安全性埋下隐患,网络威胁对电网信息物理系统的可靠性产生关键性影响。智能电网恶意数据攻击是一种满足电力系统一致性的新型网络攻击,能够绕过传统的不
女性劳动者在就业、生育等方面受到多部法律的保护,相关研究成果不在少数,结论大多为通过特殊立法保护女性、提高社保水平、加大对用人单位监管、惩罚的力度等,但有治标不治本之嫌。性别歧视是一个涉及社会学、经济学、法学等多个学科的问题,但是反性别歧视的任务常落在法学领域。因此,立法不仅要追求公平正义等价值目标,尤其是在现行法律效果不尽人意的时候,或许需要多从经济学的视角重新考虑效率问题。本文分为六个部分。第
汽车是一个实时系统,车载网络的实时性是一个安全关键问题。传统车载网络出于各种因素的考虑一般是由多条实时总线构成,比如CAN、Flex Ray等。总线之间则通过中央网关连接进行数据交换。近年来随着自动驾驶的出现,汽车需要处理大量音频视频流数据来做决策。传统的车载网络偏向于实时控制,在带宽方面较为乏力,难以在时延、带宽和实时性等方面同时满足自动驾驶的新需求。以太网以其开放性、高带宽和低成本等优势逐渐走