基于层次聚类的社区发现算法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:cmcbst
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社区结构是复杂网络的重要特性之一,寻找网络中潜在的社区结构,在用户推荐、舆情监控、公共安全等方面有重要的应用价值。基于层次聚类的社区发现算法是寻找社区结构的经典算法,可以发现复杂网络多层次的结构特征。但是现有的层次聚类方案存在局限性,采用模块度最优的单步贪婪策略,只考虑节点的一阶邻居信息,影响社区发现结果的准确性。其次,模块度作为层次聚类的目标函数和评价方法,存在分辨率限制(Resolution Limit),无法发现网络中的小社区。针对上述问题,本文对基于层次聚类的社区发现算法进行研究和改进,主要工作如下:(1)针对基于层次聚类的Louvain算法在聚类过程中只考虑节点的一阶邻居信息,观测信息不足导致容易得到次优的社区划分结果的问题,提出基于马尔可夫决策过程的社区发现算法。该算法将马尔可夫决策过程追求后续收益最大化的思想应用于聚类方案中,考虑节点的多阶邻居信息,构造了一种基于模块度后续收益最大化的多步贪婪聚类方案。实验表明该算法可以发现更合理的社区划分结构,在模块度指标上的表现优于其他社区发现算法。(2)针对模块度分辨率限制导致的社区划分过程不合理以及评价方法不准确的问题,提出基于信息熵的社区发现算法。使用信息熵代替模块度作为层次聚类的目标函数,使得聚类过程更为合理。然后从社区结构演化的角度,使用信息熵度量社区划分本身的质量,平均互信息度量社区划分过程中的稳定性,综合平均互信息和信息熵构造联合评价函数,作为社区划分评价方法。通过真实复杂网络和人工合成网络的实验表明该算法不仅可以使得社区构造过程更为合理,而且可以得到更准确的社区划分结果。
其他文献
凭借高荧光量子产率(PLQY)、合适的带隙和高电荷载流子迁移率,卤化铅钙钛矿成为了光伏、显示器、太阳能电池和闪烁体领域的广泛研究对象。然而,在实际应用中,铅基材料的毒性和稳定性是需要考虑的问题。近年来,许多铅基钙钛矿的替代材料被研究报道,其中包括锡基钙钛矿、锗基钙钛矿、双钙钛矿以及一些类钙钛矿结构的金属卤化物。具有低维结构的铜基卤化物具有优异的光学性质,凭借其高效的发光效率及可以避免自吸收的大的斯
学位
识别精度是红外电子白板质量的重要评估指标。红外电子白板光源布局的好坏直接决定了其识别精度的高低。目前,红外电子白板光源布局依旧是人工布局或者简单的均匀布局,导致红外电子白板存在识别精度低的问题。因此,红外电子白板光源自动布局方法具有显著的研究意义和应用价值。红外电子白板光源布局优化问题是一个大规模整数规划问题,决策空间大,难以用一般优化方法进行求解。针对该问题,本文开展了如下研究:(1)基于最优解
学位
流程感知信息系统将流程执行产生的数据记录在事件日志中,流程挖掘能从事件日志中挖掘实际业务流程中潜在的知识。企业或组织的业务流程因涉及不同的地域、人员或法规等而存在很多变体,不同流程变体的事件日志中存在差异。流程变体分析是流程挖掘的一个范畴,能够从事件日志中发现两个流程变体的差异,对流程变体进行比较分析,从而为流程标准化、流程改进和拓展等提供帮助。现有流程变体分析的研究主要是发现变体间的差异,一些方
学位
铅酸电池因具有成本和安全性方面的优势被广泛应用于储能领域。然而当铅酸电池在实际应用时,负极在部分荷电状态(Partical-state-of charge operation,PSo C)下很容易发生不可逆硫酸盐化现象,大大限制了使用寿命。和传统铅酸电池相比,铅炭电池可以明显抑制负极硫酸盐化,但是铅炭电池中的碳材料具有较低的析氢过电位,很容易加剧析氢反应。因此,为了解决析氢问题,有必要对碳材料本身
学位
随着互联网技术的快速发展,网络负担日益加重,推荐系统能够帮助用户解决信息过载问题,为用户提供高效、精准地获取个性化信息的服务,因此受到学术界和工业界的广泛关注。目前大多数推荐模型只是基于用户与项目的交互关系进行建模,而忽略了用户属性和项目属性的辅助信息,以及忽略了用户与用户之间、项目与项目之间的隐藏信息。另外,由于图卷积网络结构的特点,当网络层数加深时,节点的特征会趋于相似,出现过平滑现象,导致模
学位
作为第三代有机电致发光材料,热活化延迟荧光材料(TADF)中三重态激子能够通过反系间窜越(RISC)转化成单重态激子,从而参与荧光发射,理论内量子效率(IQE)达到100%。其相较于传统荧光和磷光材料而言,器件发光效率较高,生产成本较低,故而吸引了全世界的目光。当前TADF材料亟需解决的问题之一是效率滚降,而研究发现:提升反系间窜越速率(kRISC)会缩短延迟荧光的寿命,有利于抑制效率滚降;给受体
学位
当前,每天都有数以亿计的图像和视频被上传至网络供人使用。但是,受拍摄时电子设备内部硬件条件或外界自然环境等因素的影响,可能导致图像的清晰度不佳。并且,由于显示器的分辨率不断提高,人们对图像和视频清晰度的要求不断增加,如何快速且有效地提升视频的分辨率成为一个日益重要的问题。超分辨率技术是解决这一难题的主要方法之一。视频超分辨率的目标是利用多帧低分辨率视频帧恢复高分辨率视频帧,相关成果可以广泛应用于高
学位
分辨率是一种用来衡量影像清晰度的概念。高分辨率的影像能够展现出更多的细节纹理,提升影像的质量和观感。为了满足获取高分辨率影像的需求,超分辨率算法被广泛且成功地应用在多个领域当中。目前,基于深度学习技术的超分辨率算法能够在有限的硬件设备条件下提高影像的分辨率。视频序列作为多个按时间顺序排列的图像帧,如何挖掘其中蕴含的丰富特征信息显得尤为关键。多帧视频的特征信息主要包括单个视频帧本身的空间信息,以及该
学位
随着微服务架构的快速发展,大量微服务使得服务管理复杂度和运维成本陡然提升,需要通过服务治理提供多种服务基础设施,从而提高微服务管理效率、降低企业运维成本,同时确保微服务的运行质量。Kubernetes是当前使用最广泛的容器编排系统,通过容器技术可以标准化管理微服务,可为实现微服务灵活扩展,高效维护提供基础支撑。本文基于Kubernetes设计并实现了微服务治理平台,并着重对Kubernetes调度
学位
碳-氟(C-F)键的键能很高,导致其反应活性较低,很难在常规条件利用过渡金属配合物进行活化,这是有机合成化学领域目前面临的一个很大的挑战。近年来,利用过渡金属催化氟代芳烃实现各种C-F键活化是化学领域的前沿研究课题。尽管当前已有多种较为先进的分析检测技术,然而,由于反应条件较为复杂,可能性路径较多,一些关于机理的细节仍然较为模糊,这些都一定程度的限制了后续的实验拓展研究。值得注意的是,近些年理论化
学位