论文部分内容阅读
近年来,网络结构与演化机制已成为复杂网络研究的一个主要问题。学者们对于复杂网络的研究涉及到物理学、生物学、经济学、信息学等越来越多的学科。如何通过对于已观察到的网络节点之间的拓扑连接信息,来发现未观察到的或在未来将会出现的连接,这一问题成为愈来愈重要的研究点。复杂网络的链路预测是指对未知链接或未来链接的预测。链路预测问题的主流研究点是基于拓扑结构相似性方法,这一发展随着研究的深入将越来越系统。因为根据已存在的网络结构不仅更易获得,也更加可靠,更重要的是具有普适性,避免了不同网络需要机器训练获得参数的繁琐过程。例如,在科学家合著网络中,有两位科学家从来没有合作完成过论文,然而由于工作调动而到一个机构中后,可能在以后几年会合作研究。这一类原因导致的合作是很难预测的。但是根据网络拓扑结构,如他们所属的圈子越来越来越“近”,则可判断未来两人合作的可能性就越来越大。对于复杂网络中的链路预测研究,中外学者于不同角度提出各种相似性算法,并应用到实际数据中。本文详细阐述了各种经典相似性算法,并在共同邻居算法(CN算法)的基础思想上,考虑到节点本身拓扑性质——在网络中,节点度有大有小,度小的共同邻居节点往往比大于度大的共同邻居节点作用更重要,改进指标定义可考虑节点对的相似性分数,引入共同邻居度数分之一。因此提出基于度值贡献的共同邻居改进算法(CNBD)。为了验证其有效性,用四个真实网络数据集,通过Gephi网络分析软件进行网络拓扑特征数值的获取,以及Mtlab仿真实验对精确度AUC的计算,得到改进算法CNBD与其他几种相似性算法的精确度比较,得出结论,CNBD算法总体上优于其他几种相似性算法,可在以后的相关研究中使用。