论文部分内容阅读
有效的节点相似性度量方法有助于深入理解复杂网络拓扑结构及动态特征,发现信息、流行病、谣言等数据在网络中的传播规律。基于全局的方法利用节点间的路径信息来计算节点相似性,通常计算代价高,且基于全局路径的节点相似性度量方法容易导致大度节点成为一般相似节点;基于局部信息的方法利用节点邻域相关的结构信息度量节点间相似性,降低了计算维度,有助于分析大规模网络的拓扑结构。但目前存在一些局部方法问题,如基于公共邻居的度量方法仅使用了较短距的结构信息,使得节点间的结构差异难以区分。本文对基于局部信息的节点相似性度量问题开展研究,提出了两种基于相对熵的网络节点相似性度量方法,主要工作如下:(1)针对基于随机游走的节点相似性度量模型中存在的大度节点依赖问题,从信息论的角度提出了一种基于相对熵的随机游走相似性度量方法(A random walk similarity measure model based on Relative Entropy,RE-model)。首先根据随机游走模型得到网络中节点的转移概率向量,利用节点经过多步随机游走后到达网络中影响力较大的节点的转移概率来构造该节点的转移概率分布,计算两个节点的转移概率分布的相对熵以得到网络中节点对之间的差异分数,进而得到网络节点间的相似性矩阵。RE-model度量方法降低了传统随机游走相似性度量对于大度节点的依赖性。通过在真实网络数据集上的实验表明,RE-model算法在对称性、网络传播及社区发现等方面表现良好。(2)针对现有节点相似性度量对于高度相似的节点对难以区分其结构差异等问题提出了一种基于局部连通相对熵的节点相似性度量方法(Measuring node similarity in networks based on local connectivity relative entropy,LCRE),首先通过节点有限步闭邻域的导出子图构造每个节点的局部网络,且定义每个节点的邻域连通概率分布,然后利用相对熵计算节点对间的结构差异,进而得到节点间的相似性分数。LCRE考虑了节点的局部连通结构信息,破坏了现有节点相似性度量方法所造成的最相似节点集合“简并性”问题以及对于大度节点的敏感依赖,使得这些节点间的相似性分数更具区分性。通过在真实网络上与一些经典算法在对称性及网络感染及恢复能力、节点影响力等方面进行实验分析,表明LCRE算法能够更准确地度量节点间的结构相似性。