基于节点属性和拓扑信息的重叠社区发现算法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:hyhf_lwh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在万物互联的信息时代,每天都会产生大量的数据,并且数据之间存在着复杂的联系。这些数据中大多数都是以网络形式存储,充分保留了数据实体之间的关系。此外,一些复杂系统中的实体往往具有属性信息,这些信息可以为实体表明其特征或者构建语义上的关联。而研究网络实体之间的结构信息以及将结构与属性信息结合进行社区划分是发现网络中隐藏特征的关键所在,因此研究更合理的社区发现方法显得尤为重要。然而,现实网络中的稀疏连接和节点的异质性等情况给重叠社区检测带来了诸多挑战。如何将节点的特征和节点之间的亲密关系结合起来以发现社区,仍然是一个值得学者们探讨的问题。因此为了挖掘更合理的社区结构,通过对复杂网络进行深入分析,本文在重叠社区发现方法上进行了创新,主要内容概括如下:1.针对节点拓扑差异的度量问题,提出一种基于节点局部拓扑信息方法评估网络中节点的重要性。此外,本文扩展了计算节点之间相互影响的方法用于度量网络中节点之间的关系。其次本文提出了一种可挖掘重叠社区结构的标签传播算法CILPA,用于检测大型网络中的社区结构。最后在算法中加入了标签检查策略以降低节点间链路过于稀疏的影响。通过大量实验证明了算法能够高效及准确的发现复杂网络中的重叠节点和社区结构。2.针对属性网络上重叠社区划分结果不佳问题,本文提出了一种基于属性网络表示学习的重叠社区检测方法OCDARL。首先,根据网络拓扑信息和节点的属性矩阵作为嵌入算法的输入,将它们通过严格的参数训练得出最优的属性和结构的嵌入表示。然后改进上述的标签传播算法中的节点相似度计算方式,使得算法能够计算属性之间的相似度,同时能够检测到属性网络中的重叠社区。最后通过与真实算法和相似度计算方法比较,验证了OCDARL算法在属性网络上发现社区的可行性和有效性。3.本文根据以上所述的研究内容设计并研发了一个重叠社区发现综合应用系统,该系统的功能包括数据管理、数据可视化、社区发现、结果可视化分析等功能。
其他文献
基层治理中存在的形式主义正在消解基层治理效能。基层治理中形式主义大致可分为制度形式主义、数字形式主义、组织形式主义三种样态,其消解基层制度执行力,导致数据赋能异化,消解组织引领力,是基层行政效率低下的主要原因。整治基层形式主义,要提升制度执行力,以制度优势驱动治理效能提升;要善用信息技术赋权增能,以智能加速治理效能提升;要推进基层党组织建设,以党建引领带动基层治理效能提升。
期刊
随着互联网在各领域的广泛普及和应用,大量工业数据及应用数据呈爆发式增长的态势。由于大多数数据的维度较高,且无法确保所有特征都被采集到,这导致传统神经网络算法使用人工合成值预填充数据这一过程变得极为低效。针对此,本文提出了以下两个研究内容:(1)隐特征分析方法可以高效提取高维不完备数据的完备特征,在协同过滤等问题上有较好的效果。但这类模型大多基于矩阵分解的思想,仅仅在于提取不完备数据的线性特征。自编
学位
工业物联网通过使用传感和网络技术为工业系统提供产品可追溯性,参与者能够有效地跟踪产品并在生产过程中记录其状态。当前的工业物联网系统的产品数据共享服务是有中心的,当参与者获得不可信的产品数据时无法溯源,DAG区块链可以解决这一问题。DAG区块链技术不仅具有链式区块链去中心及防篡改等特性,而且能够容忍分叉,效率更高,但是仍不能解决在DAG区块链上存储产品数据时存在的数据隐私安全问题。基于上述问题,本文
学位
形式主义是一个长期困扰基层治理的复杂社会政治现象,具有多方面的生成诱因和表现形态。在现代复杂性社会条件下,传统意义上的“政治运动式”“被动应付式”“单一施策式”等解决思路和治理对策对形式主义治理显得捉襟见肘。新形势下,要按照中央要求和部署,通过持之以恒深化治理改革、优化治理结构的角度去寻找解决良策。协同治理理论与解决当前形式主义问题在理念、举措、机制和效果诸多方面具有契合之处,有助于识别形式主义现
期刊
经济的迅猛发展促使人们生活质量的提升,生活质量的提升间接促使交通道路的高频率使用,道路里程数的逐年递增。国家为建成交通强国出台各项政策,支持智慧交通的建成,高质量的公路在其中扮演着重要角色。巨大的道路里程数导致公路养护存在着海量的工作,而养护中重点关注的危害就是路面的裂缝。裂缝应尽早发现,评估严重程度,做出对应的养护决定。早先的裂缝发现与检测工作主要依赖于低效率、低回报率的人工检测,如今面对如此巨
学位
随着化石能源的持续消耗,能源短缺与环境恶化的危机迫在眉睫。太阳能储量丰富、清洁可再生,是代替化石能源的理想选择。在传统的太阳能利用方式中,光利用技术只能响应光谱部分波段的太阳光,而热利用技术虽然可以响应全光谱的太阳光却降低了高频波段光子的能量品质。为提高整体的利用效率,太阳能综合利用技术已成为当前的研究热点。其中,基于光热协同反应将高频波段光子能量用于合成高附加值的太阳能燃料,基于辐射的热效应将低
学位
如今,随着Web 2.0的普及,社交网络在知识分享和新产品传播方面发挥着不可思议的作用。人们可以在任何时间、任何地点分享自己的观点,意见领袖是在社交网络中用户与用户之间的互动产生的。由于其在现实中的广泛应用,包括电子营销市场和信息教育等行业,识别意见领袖的问题一直吸引着越来越多的研究。现有的大多数学者在研究意见领袖识别问题时没有进行意见社区的划分,导致影响力重叠问题;同时由于在意见领袖的识别过程中
学位
数字图像作为信息时代的主要载体拥有极大的表达潜力,其获取、分发和存储的便利性使得它们被用来广泛传播信息。互联网的普及和计算机技术的发展导致人们可以轻而易举的对一幅图像完成篡改,而这些虚假信息的传播不仅会给社会带来危害也会影响决策者们在重要场合的判断。图像篡改根据其语义内容是否发生改变可分为局部篡改和全局篡改。全局篡改仅改变图像整体视觉效果而不改变其语义内容,常用于局部篡改操作之后,旨在隐藏局部篡改
学位
随着移动互联网的普及,网络上的信息数据不断增加,用户面临着信息过载问题,推荐系统就是在这种背景下产生的。推荐系统从大量动态生成的信息中过滤出重要的信息数据,深入发掘出用户的兴趣偏好。但在实际应用中,推荐系统的性能受制于评分数据的稀疏和用户的冷启动等各方面的问题。跨域推荐可以利用用户在其他领域内的交互数据来丰富当前领域的稀疏数据,再加上互联网应用中,用户画像和产品属性信息的丰富及多元化,推荐系统可以
学位
现如今多机器人系统已经成为机器人领域的重要研究方向,多机器人系统通过在环境中部署多台机器人来完成单一机器人难以完成的大型复杂任务。随着近年来人工智能领域和自动化领域的不断升级,多机器人系统凭借其高效、高质、均衡等特点在军事、生产、电子游戏等领域都展现出了强烈的需求。在多机器人路径规划这一研究中,根据控制结构的不同分为集中式规划方式与分散式规划方式。集中式规划是目前实际应用的主流选择,其优点为较为成
学位