论文部分内容阅读
复杂网络的链接预测是数据挖掘与复杂网络的一个交叉性的研究方向,在生物信息学、人类社交网络、交通网络等方面都有重要的应用。链接预测是根据网络中已知的节点属性和结构等信息预测两个节点之间存在链接的可能性,目前链接预测研究的热点方向是基于相似性的算法研究,这类研究的重要前提是网络中两个节点之间的相似程度越高,则两者越有可能产生链接。基于相似性的链接预测算法能较为充分地利用节点的属性信息及网络的拓扑结构信息,计算时间复杂度低,相对容易实现,适用于大规模网络,且可以获得较高的预测准确率。然而,目前的几种针对无权无向网络链接预测的经典算法运用的网络拓扑结构信息有限,大多是从被预测的两个节点的共同邻居出发,只考虑被预测的两个节点共同邻居的个数和单个共同邻居节点的特征,并未深入研究邻居节点之间的相互关系对预测结果的影响。针对这一问题,本文在已有的相似性指标的研究基础上,提出了一种新的链接预测算法—基于局域路径上的节点引力算法(Individual Attraction Based on Local Path Index, IALP),该算法不仅利用了共同邻居节点和间接邻居节点的度数信息,而且考虑了邻居节点集合中各节点关系的紧密程度。实验表明IALP算法能够提高链接预测的准确率。此外,近年来,越来越多对真实网络的实验研究表明,利用简单的无权无向网络来刻画真实网络的结构是远远不够的,许多重要的信息,如链接的强度、类型等,因仅考虑拓扑结构而被忽略,加权网络能更为全面深刻地刻画真实的网络体系。因此,本文还研究了加权网络的链接预测问题,提出一种处理加权社交网络的链接预测方法。根据从新浪微博上爬取到的用户信息及用户之间的相互联系信息,综合考虑网络拓扑和用户的兴趣分类等因素构建了一个新浪微博加权网络,并将已有的3种无权无向相似性指标CN、AA、RA扩展到加权网络中的链接预测指标WCN、WAA和WRA中,对该加权网络进行链接预测。实验表明扩展算法能够取得更好的预测效果。