论文部分内容阅读
无论是在自然界还是在人类社会中,随处都可以见到复杂网络的身影,例如,人类社会网络,生物网络,电路网络等。为研究这些网络下蕴含的意义和价值,就需要对网络结构进行合理的系统性的分析。目前,对于复杂网络的研究已经渗透到各个领域中,社区划分算法的研究是复杂网络研究领域中的重要内容。随着社会网络和web技术的发展,网络规模逐渐增加,需要复杂网络社区划分算法在大型的复杂网络数据上可以进行高效快捷的社区划分,这也是目前社区划分领域的研究热点。为了实现这一目的,本文从Page Rank算法获得启发,利用随机游走思想,设网络中的每个节点都具有能量,网络中节点的能量通过能量转移概率矩阵进行相互传递。整个网络中的节点经过能量的相互传递达到稳定状态后,获得能量矩阵,在能量矩阵中分析提取相互之间能量传递最多的两个节点划分到同一个社区中,逐渐实现整个划分原则,直到整个网络划分为一个社区时终止,并且利用Q值来获取最优的划分结果,这是整个算法的核心思想。随着网络规模的增大,算法在执行过程中需要大量的存储空间,当网络规模达到一定程度,算法因存储空间不足而导致无法有效执行。我们知道社交网络中节点的度是服从幂律分布的,从大规模社交网络中抽象出的邻接矩阵和能量转移概率矩阵具有稀疏性。为了进一步优化算法,利用稀疏矩阵压缩存储来降低算法执行过程中需要的存储空间。但是,在能量传递过程中,随着迭代次数的增加,矩阵的稀疏性降低。为了保持矩阵的稀疏性,本文根据矩阵的维度设定阈值来维持矩阵的稀疏性,并且通过实验来说明设定阈值的必要性以及如何设定阈值来保持矩阵的稀疏性,从而提高算法的执行效率。为了验证本文提出的算法的精确性,将算法在已知划分结果的经典小样本数据集上做了测试,获得了精确的划分结果;并将该算法在大规模网络数据集进行验证,在得到较好划分结构的基础上提高了计算效率。