基于节点影响力和信息熵度量的标签传播社区发现算法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:camisado
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社区结构是复杂网络的重要特征之一,如何有效发现社区是一个重要热点问题。标签传播算法是社区发现算法中非常重要的一类算法。本文在经典标签传播算法LPA和MLPA的基础上,使用节点影响力和信息熵的概念,针对原有算法的不足和缺陷,对这两种算法进行了改进和优化,得到了更好的实验结果。为了改进传统标签传播算法LPA中节点更新顺序的随机性和不合理性,本文引入节点影响力的概念,结合节点相似度,提出一种新的节点影响力计算方式,并将其用于改进标签传播算法。本文提出三种可用于计算节点影响力(INF)的方案,并在小型数据集上针对这三种不同方案进行了测试,用社区数量评价指标(CN)对结果进行评价,最后决定其中最优方案。基于这一方案,本文提出改进后的INF-LPA算法。在这种节点影响力计算方式的基础上,本文还借助信息论理论,对多标签传播算法MLPA进行了改善,改进后的算法能够更准确地观察和发现复杂网络中的社区结构。本研究借鉴多标签传播算法MLPA的发现过程,通过引入节点影响力和信息熵的计算,以平均互信息(AMI)为桥梁,提出一种新的社区发现算法AMI-MLPA。该算法采用了节点影响力计算与排序、AMI最大化选优等策略,首先对每一节点设定一独立标签,并根据节点在网络中的影响力大小确定传播顺序;然后,在标签传播的过程中,算法综合平均互信息与MLPA中传播强度的思想来筛选标签,通过选择平均互信息与传播强度更大的标签,得到更加合理的社区划分;最终,将标注同一标签的节点划分至同一社区。本文在真实数据集和LFR基准人工合成数据集上开展了大量实验,并使用标准化互信息(NMI)指标作为评价标准。在真实数据集上的结果表明AMI-MLPA算法划分效果总体优于Fast GN、GN、LPA、MLPA、CDRS、DCN、GLPA、GLLPA等算法。特别是,在规模为10万节点的人工合成数据集上划分结果的准确率可达98.4%,验证了算法的有效性。
其他文献
聚氨酯作为一种综合性能优异的合成高分子材料,需求市场巨大。多元醇是合成聚氨酯的重要原料,大多来源于化石资源,研发利用可再生多元醇原料既有利于环境保护,也可以促进聚氨酯生产和应用的可持续发展。木质素是自然界储量最丰富的芳香聚合物生物质,生物相容性好、绿色安全,其分子中的多羟基结构和芳香骨架赋予其优异的反应性和紫外阻隔性能,是理想的石油多元醇替代物。目前,木质素主要以填充剂或部分多元醇替代物的形式制备
在资源过度开采导致的全球变暖时代背景下,各国纷纷推出可持续发展的节能政策。岭南地区较为独特的湿热型气候使得人们在生活中大规模采用空调等主动调节气候的手段,以追求舒适的生活环境,无疑不利于节约能源,同时长期处于空调等机械控制的恒定环境中容易引起头痛咳嗽、四肢酸痛等“空调病”症状,改善了环境却不利于人体的舒适,因此减少主动式机械调节,加强被动节能势在必行。在岭南传统建筑中,往往采用天井、冷巷、庭院、廊
本文主要研究三维周期区域和全空间上带欧姆定律的双极不可压缩纳维-斯托克斯-傅里叶-泊松方程解的整体存在性和衰减性质.对于周期区域情形,先用高阶能量方法推导解的先验估计,然后证明解的局部存在性,再利用连续性方法结合先验估计证明解的整体存在性,最后推导解的指数衰减性质.对于全空间情形,利用与周期区域类似的办法证明解的整体存在性,然后利用高低频分解的方法得到解的多项式衰减性质.
颗粒尺寸是衡量药物质量的重要指标,对药物溶解度、稳定性和流动性有重要的影响。特别对于大多数难溶解药物,减小颗粒粒度是提高药物溶解度和生物利用度的重要方式之一。因此,开发微纳米药物湿法研磨技术具有广泛的应用前景。为保障湿法研磨制备的微纳米悬浮液具有较窄的粒度分布,满足产品规格要求,需要实时准确测量研磨过程悬浮液粒度分布的变化。超声波因具有穿透性强、频率范围宽、响应速度快以及非接触的特点,相较于离线粒
目的 探讨对急性心肌梗死(AMI)患者实施医护一体化急诊急救护理流程的临床效果。方法 回顾性分析本院收治的AMI患者90例的临床资料,根据护理方式分组,其中42例采用常规护理措施的患者纳入对照组,其余48例实施医护一体化急诊急救护理流程的患者纳入观察组,对比两组急救效果。结果 观察组在症状发作到急诊室、预检分诊、心电图检查、进出急诊室、经皮冠状动脉介入(PCI)治疗、门球治疗和再灌注等方面的时间均
我国现代化建设发展离不开社会主义精神文明建设,社会主义精神文明建设既需要持续提升国民科学文化素质,又需要不断加强国民思想道德修养。正因如此,图书资料作为重要的媒介,对图书资料档案信息化管理的需求也越来越迫切。本文通过分析目前图书资料档案管理现状及存在问题,提出了图书资料档案信息化管理的建设性意见,能够为相关的图书资料档案信息化管理工作提供一些可供参考的内容。
石化能源危机和环境污染的加剧让人们开始寻找清洁能源和开发能量储存与转化的新技术。超级电容器和金属-空气电池是目前比较有前景的能量储存和能量转化装置。然而,由于超级电容器电极材料能量密度不高且倍率性较差、金属-空气电池的氧还原反应(ORR)催化剂成本高、循环稳定性较差等缺点,限制了它们的进一步发展。因此,开发廉价且电化学性能优良的超级电容器电极材料和ORR催化剂是改善能量储存和转化技术的关键。以可再
脑神经科学问题探索,以及神经医学诊断和治疗,都依赖生物医疗技术的发展。目前植入式的神经探针是脑神经系统研究的主要工具之一,开发多功能的柔性神经探针是脑神经科学新需求,尤其是适用于光遗传学的、具有高生物相容性的柔性光电一体化光纤仍有待开发。此外,光学神经探针结合先进的成像技术(如基于飞秒激光的多光子成像)更为活体深层脑神经研究提供新途径。然而,针对多光子光成像技术与高生物相容性的光学神经探针结合的相
近年来,柔性化与智能化是机器人发展的趋势。机器人路径规划是提高机器人柔性化与智能化的重要环节,对制造业的生产结构改变和生产效率的提高有重要意义。本文主要基于约束分析来对机器人路径规划进行研究,提出了基于约束分析的采样单查询路径规划算法框架,并以焊接场景作为其应用示范。本文首先提出了一种基于约束分析的采样单查询路径规划算法框架,用于处理多约束多目标路径规划问题。对框架中涉及到的约束处理、规划空间和局
近年来,CLT因其绿色、环保、可持续性等特点成为替代钢筋混凝土建筑的新选择,陆续出现了以CLT(正交胶合木)为建筑材料的多层及高层住宅、办公楼、体育馆重型木结构建筑类型。但国内外学者对CLT结构的研究仍处于初步阶段,并无相关国家规范对CLT结构的设计准则进行说明。本文从CLT连接节点的力学性能出发,探究连接节点的力学性能对CLT结构抗震性能的影响,为CLT结构的研究作补充。由于目前并无紧固件数量对