论文部分内容阅读
AI、Blockchain、云计算技术的发展,使互联网与现实社会越来越重叠在一起,网络生活变成一种新的生活形态。社区发现能够将网络的拓扑结构发掘出来并作合理分析,从而揭示网络内部所蕴含的物理功能、潜在规律和数学意义,并对其现实存在的问题提供解决方案,因此受到了学术界的广泛关注。社区发现在社群划分、社区精准营销等方面具有很强的理论意义和应用价值。传统的标签传播算法在进行社区发现时,存在着节点更新次序和节点标签选择策略随机性高的问题,针对这一问题,在大量研究节点影响力和社区发现相关文献的基础上,本文以节点影响力为切入点,通过引入节点影响力的概念减少社区发现算法的随机性,从而提高了社区发现的稳定度。在非重叠社区发现领域,利用加权思想,并且将聚集系数这一指标考虑进去,提出了改进的节点影响力算法WMC。然后,将WMC算法融入LPA算法中,提出LPA-WMC算法。该算法利用WMC算法计算网络中节点的影响力并降序排列,以此确定节点的初始化次序和迭代次序,并且提出标签影响力概念,在存在多个数目相同的最大数量标签时考虑标签影响力。在重叠社区领域,将EKsd节点影响力算法融入COPRA算法,提出EKCOPRA算法,根据节点的EKsd值计算节点影响力和标签影响力,减少算法本身的随机性。为了证明改进算法的优化效果,本文分别在LFR人工生成网络数据集和三个真实社区网络数据集上进行实验。实验结果表明:改进的节点影响算法WMC与经典算法具有高度一致性,可以有效地识别核心节点。通过与原算法的对比实验,改进算法LPA-WMC算法和EKCOPRA算法得到较高的模块度和NMI值。它表明LPA-WMC算法和EKCOPRA算法可以使社区分区更接近标准分区结果。提高了原有算法的稳定性和准确度。本文的创新之处主要有两点:第一,将聚集系数指标融入WM节点影响力算法,提出WMC算法用于社区发现,将WMC算法融入LPA算法,提出LPA-WMC算法,并提出新的标签选择策略,解决标签初始化阶段和标签更新阶段的不稳定性问题。第二,将EKsd值引入COPRA算法,提出EKCOPRA算法,解决节点的随机性选择问题。一方面,由于标签影响力和节点影响力在大规模网络中仍然有很大概率相同,因此也存在着随机性。另一方面,本文的研究主要集中在无向无权网络,节点间边的重要性都被同等看待。因此,下一步的研究工作集中在有权网络中的社区发现,并且将边权作为节点影响力的衡量因素之一,用来进一步解决算法存在的随机性问题,提高社区发现算法的准确性和适用性。