基于分布式系统的网络社区探测研究与实现

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:nathon_zhwang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着在线社交网络的流行及智能移动终端设备的普及,越来越多的人将在线社交作为一种重要的生活方式,在线社交网络的数据量也愈发庞大。社区探测作为社交网络研究的一个重要方向,在研究网络结构特点、分析用户关系、探索消息传播方式及掌握舆论动向方面有重要意义。由于单机的硬件配置升级存在边际效应,以及一些传统的社区探测算法在处理超大数据时的限制,使得分布式计算模型成为处理大型社交网络数据的一个优秀解决方案。现有的分布式网络社区探测算法,在实现大型网络数据的社区探测的同时,会产生社区质量下降的问题,还有一部分算法稳定性不强,对数据节点重新排序编号会大幅影响计算结果的质量。本文在研究现有的分布式社区探测算法的基础上,提出了一种基于标签传播分区的优化分布式Louvain算法-LPPDLA算法,并将算法应用于社区探测系统。本文的主要工作为以下几点:(1)分析分布式社区探测的需求和现有分布式社区探测算法,提出三点改进:1、使用VF算法简化图数据的节点分布,缩短运行时间以优化社区探测计算效率;2、将大小约束的标签传播算法应用于图分区,提高算法稳定性;3、以虚节点增强分区之间的关联关系,并制定节点跨分区移动规则。(2)将Louvain算法结合以上三个改进,在MapReduce分布式计算模型上提出LPPDLA算法。并使用LPPDLA算法对公共数据进行社区探测计算,以验证算法的有效性及评估计算获得的社区质量。(3)设计并实现一个社区探测系统,以可视化界面提供网络数据采集功能,图文件读取功能,可以使用LPPDLA算法对网络图数据进行分布式社区探测,并以展示探测结果。通过实验对比分析,本论文提出的LPPDLA算法可以在较短时间内准确地对大型图数据进行社区探测,并且可以有效降低分布式社区探测的质量衰减问题,使社区质量达到原始Louvain算法同等水平。
其他文献
会计稳健性作为会计信息质量要求的一项重要原则,不仅能缓解信息不对称、提高决策有效性,还对提高会计信息质量具有重要作用。CFO作为实施财务决策的第一人,其主观动机会影响会计信息质量,所以CFO对会计稳健性的影响不容忽视。同时,企业为了促使高管利益与股东利益保持一致,会采取适当的激励措施,以保证经营目标的实现。那么,针对CFO采取的显性激励措施可能会影响财务政策的选择,进而影响会计稳健性。此外,内部控
随着卫星通信技术的快速发展和应用,卫星网络在政治、经济、军事等各个领域的作用得到越来越多的重视。作为卫星网络的重要主要研究方向,天基网络凭借其无国界制约限制、能实
近年来中国的综合国力不断加速发展,使得中国成为世界上最具影响力的国家之一,在国际上也发挥着越来越重要的作用,中国国内每天发生的事件也越来越受到外界关注。中国进入了
近年来,随着能源危机的不断加剧和环境问题的日趋严重,新能源开发利用技术逐渐成为学界关注和研究的重点。与此同时,土壤源热泵技术作为一项绿色低碳、节能高效的浅层地温能
本文是一篇翻译项目报告。该翻译项目报告的原文节选自《谎言猛如虎:如何在后真相时代做批判性思考》中的第二部分“评估话语”。该书由美裔加拿大认知心理学家、神经科学家
随着环境污染问题和可持续发展问题成为社会热点,电力电子设备日趋成熟,新能源的发展成为了电力系统发展的重要分支。风机和光伏阵列常经电力电子设备,如VSC,并入电网,由于其中非线性环节的存在,风电并网系统中发生的次同步振荡呈现持续的等幅振荡,系统中非线性环节对次同步振荡特性产生的影响不应被忽视。特征根分析广泛应用于电力系统振荡和小信号稳定性的研究中。然而,考虑到非线性,它无法提供关于次同步振荡特性的精
为了缓解人口老龄化对我国居民健康以及国家医疗费用支出所带来的压力,我国实行了“健康中国”的战略,旨在将疾病控制在预防以及早期治疗阶段,个人健康管理平台应运而生。本文在研究平台架构以及疾病诊断预测相关算法的基础上,设计了个人健康管理平台的基础架构,并针对老年人体征数据普遍偏离正常值造成的模型精确度低等问题,提出了高精度的老年人疾病诊断预测模型,主要工作如下:首先,分析个人健康管理的发展现状以及服务需
随着我国新一轮城镇化建设的持续推进,城市既有建筑物面临着改造和修缮问题,其中混凝土结构的增韧补强和损伤程度监测十分关键。嵌入式增强技术是一种新型高效加固技术,该方法是在混凝土结构待加固处表面开槽,将加固材料用粘结剂固定于槽内,施工工作量小且方便锚固。本文围绕嵌入式增强混凝土梁的静力加载过程,结合非接触式的数字图像相关(Digital Image Correlation,DIC)技术,实现了静力加载
目的:随着表皮渗透性稳屏障研究的深入,屏障损伤相关的皮肤炎症疾病日益受到关注。作为传统治疗方法的类固醇激素能在短期内缓解皮炎症状,但长期使用会产生严重的副作用,极大地损害了治疗效果和患者的生活水平,因此亟待寻找新型治疗方法代替类固醇激素或能与类固醇激素合用减轻其不良反应,提高疗效。既往研究显示局部使用含类肝素产品可以改善皮肤屏障功能缓解皮肤疾病症状,但其作用机制还未完全明确,其是否可以替代类固醇激
近年来,学者对基于像素级分割技术的路面病害检测进行了大量的研究。通过分析提取到的图像特性进行裂缝特征处理。通常有两种方法:一是对不同退化阶段裂缝统计特征的监督分析;二是对裂缝的全面统计分析。裂纹特征的统计意义根据其相关性进行了分类。现有的自动裂缝检测技术虽然效果较好但是价格较为昂贵(基于自动检测车技术),而价格较低的方案效果欠佳且耗时。依靠专业人员检查路面状况并对其进行评估是最简单的方法,但不够准