论文部分内容阅读
复杂网络中的各种复杂行为,如演化方向、标度涌现、群集协同行为等,不仅仅取决于个体的行为,还源于个体与个体之间的联系情况或相互作用。网络中的链接预测问题所研究的正是两个个体之间的相互作用,它从微观层面展示了网络的形成和演化机制。另外,链接预测在推荐系统、科研合作、生物科学等领域也发挥着重要的应用价值。简而言之,无论是从理论研究领域,还是实际应用方面,研究链路预测都有很重要的意义。迄今为止,链接预测算法五花八门,各有长处,但并没有一种算法完全适用于所有网络。因此现有的问题并不是提出更多的新算法,而是提出一种策略来帮助用户对特定网络选择合适的链接预测算法。本文从节点和连边两个角度讨论了影响链接产生的重要元素:节点自身活跃度、节点间相似性、节点间连接距离和节点间的连接强度,分析其对链接产生的不同影响,帮助用户选择或重构适用的链接预测算法:(1)从端点(区分于其它中间节点)自身的角度来分析其对链接产生的影响。在基于网络拓扑结构的链接预测算法中,主要关注两端点之间的连接关系,忽略了端点自身的活跃度对链接的影响。通过实验分析可得端点越活跃,其产生链接的可能性也就越大,其中度中心性和Pagerank对链接产生的影响更为显著。基于此现象,提出了一类基于端点活跃性的链接预测方法,此类方法的预测精度比原有指标有较大的提高。(2)讨论了属性相似性是否会导致链接产生?文中进行了大量的实验,发现并非所有的属性相似都会导致链接,在同配网络中,节点之间的相似性导致链接的产生;在异配网络中,节点之间的差异性导致链接的产生;在中性网络中,节点间的相似性对链接产生的影响可以忽略。这种演化机制,导致同配网络和异配网络的属性分布较为集中,其属性异质性较低,而中性网络的属性分布较为分散,异质性较高。(3)针对节点间的连接关系对链接预测的影响进行分析。文中分别从节点间距离和连接强度两个方面进行分析,实验表明节点间距离越短,连接强度越大,其产生链接的可能性越大,有时甚至起决定性作用。随后,对传统链接预测指标考虑节点间连接关系进行改进,这种改进对PA指标等完全不考虑该因素的指标提升极大。本文的内容不仅仅是对影响链接预测的因素进行了分析,还提供了一种选择链接预测算法的有效策略。首先用户可以使用简单元素进行链接预测,如节点自身活跃度、节点间相似性、节点间距离、节点间连接强度或其他可能因素,发现影响链接产生的主要因素,然后据此选择或重构更为适用的链接预测方法。综上所述,本文从影响链接产生的基本元素分析和选择链接预测算法策略两个方面进一步丰富了链接预测体系,为链接预测问题的研究提供了新的角度,在用户或商品推荐系统和社会网络分析的领域有一定的价值。