论文部分内容阅读
链路预测是网络数据挖掘中的一项基础且重要的研究内容,它是指通过已知的网络拓扑结构以及网络节点属性等信息,预测网络中由于信息丢失造成的未知链接或者未来某个时刻两个节点间可能产生的链接。链路预测问题对于分析网络演化以及研究网络缺失数据补齐具有非常重要的科学意义,并且在好友推荐、电子商务和生物制药等领域具有重要的应用价值。近年来,链路预测在计算机科学、统计物理学和生物学等众多领域受到广泛关注,很多链路预测算法从不同的学科角度被提出。在已有链接预测方法中,矩阵分解方法通过低秩近似原有网络的邻接矩阵来解决链接预测问题,是一类重要的链接预测方法。在基于矩阵分解的链路预测相关方法中,已有方法大多是基于网络的邻接矩阵表示来进行建模,对网络的表示与建模仍然不够准确。为此,本文针对基于矩阵分解的链路预测算法进行了深入的研究,主要内容包括以下两个方面:(1)提出了一种基于边重要度的矩阵分解链路预测算法。该算法从节点度值信息角度提出节点间连边重要度度量方法,对网络中已知连边进行重要度度量,建立基于网络权重矩阵分解的链路预测模型。分别在八个公开网络数据集上与基于度量的链路预测算法和已有矩阵分解预测算法相比较,该方法能够一定程度上提高链路预测精度。(2)提出了一种基于聚集系数的矩阵分解链路预测算法。该算法在基于边重要度的矩阵分解链路预测算法的基础上,进一步考虑节点聚集系数对节点间连边重要度的影响,从而建立基于网络权重矩阵分解的链路预测模型。分别在八个公开网络数据集上与基于度量的链路预测算法和已有矩阵分解预测算法相比较,该方法能够一定程度上提高链路预测精度。实验结果表明该模型能够获得更好的链路预测结果。本文针对已有矩阵分解链路预测算法假设性过强的问题,提出两种新的矩阵分解链路预测算法,提升了预测精度,进一步丰富了基于矩阵分解的链路预测方法体系。