论文部分内容阅读
复杂网络影响力度量是指对网络中个体重要性的大小衡量(也称中心性度量),在舆情监管、重要个体管控等方面具有十分重要的应用价值。传统的中心性度量方法有度中心性(dc)、亲近中心性(cc)、中介中心性(bc),K壳中心性,PageRank(pg)等,但因为传统度量方法在度量效果或计算复杂度方面的局限性,不适用于较大规模网络的影响力度量。对此,为兼顾度量效果和计算复杂度,近年来兴起了基于节点的半局部结构的中心性度量方法研究。本文的工作主要有两方面:第一,因各度量方法的提出与验证中所用数据不具有统一性,为了进一步准确、全面地比较这些半局部中心性度量方法的性能,本文选取了多个在研究领域通用的公开数据集,涵盖了不同网络规模、连通性、平均距离等特征,作为实验网络数据,旨在将这些度量方法在相同网络中进行横向比较研究。网路中节点实际影响力以领域内通用的传染病模型模拟得出,评价指标采用肯德尔相关系数,可区分性(单调性、差异性)和鲁棒性。根据实验结果得出各度量方法的性能表现,主要结论有:(1)bc,ks,cc,bc,pg等传统度量方法在度量效果和计算时间上的表现普遍低于半局部中心性度量方法。(2)LSC和THCC度量方法在肯德尔相关系数这一重要评价指标下普遍优于其他基于半局部结构的中心性度量方法,且LSC适用于平均距离大于2的网络。(3)SEIC和LW主要以节点间的连接来衡量节点的影响力大小,实验结果表明其适用性较差。第二,根据不同度量方法的比较研究,从LC中“二阶邻居数”获得启发,提出了“二阶聚类系数”的概念,将之应用到LSC的改进中并提出了LSC_plus度量方法。通过化嵌套循环迭代为线性迭代的方式,降低LSC_plus的计算复杂度至,减少时间消耗。在评价LSC_plus的性能时,除了肯德尔相关系数、可区分性和鲁棒性,增加“重叠率”这一评价指标,目的在于弥补肯德尔相关系数针对网络中最具影响力节点度量时只能考量节点集序列的“相对位置”而不能考虑“绝对位置”的不足。“肯德尔相关系数”与“重叠率”互相补充,对LSC_plus和LSC度量方法进行了更为全面的衡量。主要的实验结论有:(1)LSC_plus度量方法在网络全局相关性、算法可区分性和鲁棒性方面的表现与LSC大致相当,或者略优于LSC。(2)LSC_plus度量方法在对网络中最具影响力节点的度量中,准确性较LSC有了明显提高。这契合在对大规模网络的分析中,研究者更加关注网络中最具影响力个体的现实需求。