基于标签传播的重叠社区发现研究

来源 :内蒙古科技大学 | 被引量 : 0次 | 上传用户:luckylzh_luo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据时代的到来导致了复杂的网络结构不断呈现,复杂网络是复杂系统的高度抽象,在研究网络的拓扑结构以及节点属性方面至关重要。复杂网络可以用节点和边构建的图模型表示,小世界性、无标度性和社区结构性是其最显著的特点,其中社区结构性表达的是网络中节点的聚合群体特性,该特性的挖掘即社区发现是通过节点与邻居节点间的紧密联系程度进行社区聚类,同一社区彼此紧密连接而不同社区节点联系相对较弱。社区发现对理解复杂网络系统的功能和组织至关重要。随着网络的日益复杂,重叠社区发现在现实中有着非常重要的意义。本文是以较经典的COPRA社区发现算法为基础进行优化和完善,充分考量节点个体属性及节点间的关联度量,基于此本文提出了一种综合节点影响力的NI-COPRA算法。首先,提出了使用En Renew算法度量节点重要性,其是以信息熵为基础,依据该重要性确定节点标签更新顺序;其次,设计了一种融合节点重要性和相似性的节点影响力度量方法,进一步确定社区从属系数并进行标签传播;最后,基于节点标签实现重叠社区发现。1、传统的重要性排序算法有的仅考虑了节点的度或者仅考虑一阶邻居,针对标签传播算法COPRA中选取初始节点随机性的问题,本文提出使用En Renew重要性排序算法作为节点重要性的衡量,通过该算法获取网络中的节点重要性排序,得到节点的传播路径,再通过SIR模型进行实验验证,可证实该重要性排序算法在网络传播方面具有一定优势。2、在COPRA算法中标签传递随机性问题的基础上,本文引入了节点影响力的概念,节点影响力的定义充分考量了节点的重要性,即节点的个体属性,同时也引入了节点间的关联性即节点的相似性,其中本文的节点相似性是由Node2vec模型产生的节点序列,然后利用Skip-gram模型对目标序列进行训练,从而获得向量的表示,再通过余弦相似度得到节点的相似性衡量。3、通过所提出的节点影响力定义,将节点影响力加入节点从属系数当中,通过从属系数进行标签的选择,获得最终的重叠社区。本文实验选用9个真实网络数据集和两组人工生成网络数据集,首先,在其中6个真实网络上将vote算法、k-shell算法以及degree算法作为对比实验来验证重要性排序算法的有效性,在6个数据集上均表现出较好的实验效果。其次,在9个真实网络和两组人工生成网络上将传统COPRA算法、LPANNI算法作为对比实验进行社区发现的验证,实验结果表明,算法在EQ与NMI两类指标上优于其它算法,提高了重叠社区发现准确性,从而进一步证明了本文提出算法NI-COPRA的优良性能。
其他文献
稀土电解过程中,电解槽内部包含多种复杂的物理化学变化,槽内众多参数存在不确定性且无法连续或在线测量,属于复杂的工业过程。氧化稀土作为稀土电解的原料,电解槽内氧化稀土的浓度状态关系到生产过程中电解槽内部的物料平衡,会直接影响出炉稀土金属的品质。目前,国内外多数稀土电解厂家仍采用人工手动的方式添加氧化稀土,少数厂家采用定时定点下料装置添加氧化稀土,这些下料方式未充分考虑电解槽内部氧化稀土浓度状态对电解
学位
在北方寒冷的地区,供暖是日常生活的基础保障。目前,一些用户仍然使用燃烧散煤的方式保障供暖需求。燃烧散煤不仅消耗大量化石能源,而且也造成环境污染问题。为此,国家提出了“煤改电”的政策,且在日后的生产发展中,提倡使用清洁能源,减少对化石能源的依赖,实行清洁能源和储能结合的方法。通过光伏储能与热泵供暖结合,对储能过程的双向DC-DC变换器进行研究。首先,分析了在蒙西部分地区的电采暖电价,并结合太阳能发电
学位
在服装行业迅速发展的当今,我们可以看到多姿多彩和形态各异的设计,人们往往用各种风格去定义它,但更注重传达思想、情感的一类服装设计是很难去定义所属风格的。坎普与服装设计的融合可以说就是其中之一,随着坎普风在时尚行业慢慢崭露头角,大部分人往往会被其风格所吸引,但并不知道如何去“描述”和感悟到设计者的想法。在此背景下,本文希望通过对于“坎普”的分析研究去探索坎普风与女装设计的融合手法。本次毕业设计的主题
学位
在环保话题火热的当今,我国风电事业在能源政策的领导下得到蓬勃发展,并在全国各地建成八大“千万千瓦级风电基地”。为了维持风电机组的正常运行,定期的检修工作必不可少。目前风电场的检修工作一般由专业的检修工人完成,检修工人通过攀爬器爬至高空,对设备进行检查,并通过纸笔对检修情况进行记录。一般的风电机组在50米以上,百米风电机组也在随着需求的增加而逐渐投入使用,这对检修工人的安全产生了极大的威胁。与此同时
学位
<正>发改能源规〔2022〕53号各省、自治区、直辖市、新疆生产建设兵团发展改革委、能源局、工业和信息化厅(委、局)、财政厅(局)、自然资源主管部门、住房和城乡建设厅(委、管委、局)、交通运输厅(局、委)、农业农村厅(局、委)、应急厅(局)、市场监管局(厅、委)、消防救援总队,国家能源局各派出机构,国家电网有限公司、中国南方电网有限责任公司:
期刊
进行奶牛的科学饲养,意味着需要实时掌握奶牛的行为表现等信息。奶牛精量饲喂系统对于提升奶牛养殖场效益与科学饲喂方案的研究都具有很好的应用价值。目前对于奶牛精量饲喂系统中数据监测部分关键技术的研究,普遍基于可穿戴设备监测动物状态、获取动物行为数据。借助统计、机器学习、深度学习等方法分析数据,也在一定范围内进行了应用。但可穿戴设备需要根据不同的监测对象,在设备的定制、佩戴、维护上成本较高。诸如此类的个体
学位
随着物联网和传感器等技术的发展,医疗物联网设备数据收集范围更广泛且数量更巨大,促进了智慧医疗和个性化医疗等领域的蓬勃发展。用户通过共享可穿戴物联网设备收集的健康数据实现疾病的远程诊断,以便用户及时了解自己的身体状况。但这些健康数据包含血压、心跳等用户个人的敏感信息,一旦遭到泄露或恶意传播将会给用户个人生活带来诸多不便。因此,实现智慧医疗和个性化医疗领域中健康数据安全灵活共享,同时避免共享过程中存在
学位
移动机器人在未知环境中通过传感器采集图像来精确定位自身所处位置,并对周围环境进行地图重建的技术称为同步定位与地图构建(Simultaneous Localization And Mapping,SLAM)技术。作为SLAM技术前端的视觉里程计主要是对传感器提取到的图像进行特征提取和匹配,从而估计出机器人的运动轨迹,为后续的工作提供数据支持。本文针对移动机器人的前端视觉里程计进行研究,主要工作如下:
学位
盐城有着两千多年的产盐历史,聪慧勤奋的盐城人创造了灿烂辉煌的海盐文化。底蕴丰厚的海盐文化遗存是中国海盐业发展的历史缩影。璀璨的海盐文化是盐城沟通世界的桥梁。多元的海盐文化符号融入城市建设是重塑名实相符的现代化"盐"城的必然选择。
会议
腈纶纤维具有力学性能佳、蓬松性好、耐酸碱等优良特性,但其吸湿性差、回潮率低、易起静电等不足,降低了腈纶服装的热湿舒适性,限制了腈纶纤维的进一步发展,开发服用舒适的腈纶纤维和面料具有重要的现实意义。达芙丝纤维(Defrostex TMfiber)是日本东洋纺株式会所新开发的腈纶改性纤维,具有高吸放湿特性。本课题采用达芙丝纤维为原料,分别对不同阶段的纤维、纱线及针织物进行性能测试和对比分析,为达芙丝纤
学位