论文部分内容阅读
随着Web 3.0的飞速发展,社交网络规模高速增长,并呈现出了更加明显的社区结构特征。因此,广大学者们纷纷对社区发现问题展开研究,社区发现算法也因此层出不穷。其中,LPA标签传播算法由于时间复杂度为线性,且无须预先定义社区数目和规模而得到了广泛的应用。然而,传统的标签传播算法将每一个邻居节点都视为具有同等地位,仅仅根据邻居节点的标签个数来更新标签,导致社区划分结果存在不确定性。此外,现有的社区发现研究大多是围绕无权网络来展开的,没有考虑加权网络中的边权值所能表达的重要意义。因此,为了解决标签传播算法准确度和稳定性不高的问题,本文针对加权网络的社区发现问题展开研究,对标签传播算法作出了层层递进的改进:(1)首先,提出了融入节点间紧密度的标签传播算法,加入了对边权值的考虑,用于度量节点间紧密度,根据节点间紧密度计算标签的影响力,进而进行标签更新;(2)其次,继续提出了融入节点影响力和节点间紧密度的一阶标签传播算法,除了考虑边权值,还加入对点权值的考虑,通过一阶PageRank算法计算节点的影响力,结合节点间紧密度计算直接相邻节点的标签的影响力,进而进行标签更新;(3)然后,继续提出了融入节点影响力和节点间紧密度的二阶标签传播算法,除了考虑直接相邻节点,还加入对二阶相邻节点的考虑,通过二二阶PageRank算法计算节点的影响力,结合节点间紧密度计算直接相邻节点和二阶相邻节点的标签的影响力,进而进行标签更新;(4)最后,本文尝试继续扩展到了三阶标签传播算法。通过在多个不同规模的数据集上分别运用各个算法进行多次社区划分,对比模块度平均值和节点成对概率平均值来验证各个算法的准确度和稳定性,得出以下结论:(1)融入节点间紧密度的标签传播算法与融入节点影响力和节点间紧密度的一阶标签传播算法能依次提高算法的准确度和稳定性;(2)二阶标签传播算法在中大规模的加权网络中比一阶标签传播算法具有更高的准确度和稳定性,但在小规模的加权网络中的性能可能优于,也可能不如一阶标签传播算法,需要根据实际情况而定。总的来说,一阶和二阶标签传播算法具有相对较好的性能。因此,本文最后综合运用一阶标签传播算法和二阶标签传播算法实现了对多路径传输系统的动态社区发现,能够根据不同时间段对应的网络结构选择更优的一阶标签传播算法或二阶标签传播算法进行社区发现,进一步验证了一阶标签传播算法和二阶标签传播算法还具有实际应用价值。