论文部分内容阅读
随着科技社会的发展和网络信息技术的进步,复杂网络的链接预测问题已经成为计算机科学、社会科学、复杂系统等领域中的重要研究方向之一。在自然界中,大量形形色色的系统都可以通过复杂网络来描述,比如神经网络、电力网络、航空网络、用户-商品网络等。链接预测是通过已知的网络的拓扑结构对缺失的链接和未来可能产生的链接进行预测。在社会网络中,链接预测可以发现人际之间潜在的联系,揭示用户潜在的朋友,以及在电子商务中向客户推荐商品。在现实世界中,网络中的个体之间往往包含多种关系,然而当前复杂网络的链接预测研究集中在单一关系的网络中。但除了网络自身的拓扑结构,关系之间的影响力和关联程度也会决定链接存在的可能性。而传统的链接预测方法通常只关注网络中的一种关系或把所有关系当作同一类型处理,这些做法遗失了很多重要的信息。本文针对多关系网络的特性,融合网络的拓扑结构信息和关系的相似性,设计更精准高效的链接预测算法。本文的主要研究工作和成果如下:(1)提出了一种基于随机游走的链接预测算法。我们计算出每种关系中所有顶点对之间的相似度,定义每两个顶点链接的边上的传播概率为其他所有关系中这两个顶点间的相似度之和。然后顶点间的相似度根据传输概率在网络中以随机游走的方式进行传播和更新,最终得到顶点间的相似度作为链接预测的结果得分。实验结果显示,我们的算法在多关系网络中取得了比其他算法更精确的预测结果。(2)提出了一种基于顶点影响力的链接预测算法。我们用影响力传播的方法分别求出每个顶点在不同关系中的影响力,并构成各个关系的特征向量,以特征向量的相似度作为关系之间的相似度。我们通过关系的相似度和顶点间的交互次数得到所有连边的权值再进行顶点间的链接预测。我们的实验结果显示,我们的算法相比其他算法在多关系网络中取得了更好的预测结果。(3)提出一个基于社区挖掘的链接预测算法。我们首先求得各个关系间的相似度,构造每种关系的带权图,在带权图上进行社区挖掘。然后计算所有顶点对之间和各个社区质心的相似度分别作为顶点初始相似度和社区的相似度。最后通过顶点初始相似度与社区相似度计算得到链接预测得分。实验结果显示,我们的算法可以取得更高的预测质量。