基于节点重构思想的链路预测算法研究

来源 :武汉大学 | 被引量 : 1次 | 上传用户:phenix519
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实生活中许许多多的复杂系统可以用网络加以描述。系统中的个体用网络节点表示,个体之间的联系和交互关系用连接边表示。一方面,由于采集成本、采集难度等因素,网络的结构信息往往是不完整的,因而存在未知链接。另一方面,绝大多数的网络都是动态的,会随着时间进行演化,产生新的连接边,称为未来链接。链路预测是一项挖掘网络信息的研究工作,它根据观察到的网络结构信息来预测网络的缺失链接(包含未知链接与未来链接)。链路预测问题不仅能帮助我们理解网络的演化机制,还能发掘网络中未知的、有价值的知识,因而具有重要的理论研究意义和应用价值。目前,基于相似性的链路预测算法通常只关注两个节点之间的相似性,没有做好相似度的分配工作。而“相近节点”和“热门节点”的存在,会使得高相似度节点之间包含大量的冗余信息,从而影响预测效果。针对信息冗余问题,本文提出了线性重构的方法计算相似度。首先,以节点的代数近邻作为线性重构的基,即通过节点的代数近邻去解释它的连边情况,以重构系数作为节点相似度。实验结果表明,虽然代数近邻是通过共同邻居指标筛选出来的,但经过线性重构的方法重新计算相似度后,其效果远远优于共同邻居指标,从而证实了线性重构思想的有效性。其次,考虑到在大多数网络中两个节点是否连边与其相似度有较大关系,本文将节点的一跳邻居(几何邻居)作为线性重构的基,利用线性重构的方法计算相似度。最后,通过线性加权的方法将代数近邻与几何邻居的信息结合,从而得到加权的线性重构相似度,再利用协同过滤的方法对链路进行预测评分,整个方法称为基于加权的线性重构相似度的协同过滤算法。基于加权的线性重构相似度的协同过滤算法包含两种形式:一般形式的WLRS算法、非负形式的WLRS-N算法。本文选取9种具有代表性的算法作为对照,在10个来自不同领域的真实网络进行了大量的数值实验。对算法的参数、收敛性、有效性、预测准确度、计算复杂度以及鲁棒性分别进行了讨论与分析。在预测效果上,WLRS、WLRS-N表现优秀,显著优于9种对比算法,大幅优于CN、AA、RA等传统算法。在计算复杂度上而言,WLRS算法的复杂度非常高,仅能用于理论研究,而改良的WLRS-N算法的复杂度大幅度降低,其复杂度高于CN、AA、RA等传统算法,略比结构微扰方法(SPM)高一点,但远比随机分块矩阵模型(SBM)低。在鲁棒性上,WLRS-N整体上具有较高的鲁棒性,优于CN、AA、RA、SBM、NMF等算法。总体来说,WLRS-N算法具有较高的精确度、适中的计算复杂度和较强的鲁棒性,而WLRS算法在理论分析上有重要的贡献。
其他文献
在流行病学、生物医药等领域的研究中,个体会反复经历同一事件,也就是复发事件.复发事件最重要的特征就是个体的复发时间是有序且相关的.复发事件数据分为时间相关数据和时间
节能与环保是当今汽车领域发展的主题,电动化、智能化、网联化是汽车产业的发展方向。本文以智能网联电动汽车为研究对象,针对当前电动汽车续航里程短、电池寿命衰减快的问题
端粒酶是一种逆转录核糖核蛋白酶,可以催化合成端粒重复序列,维持基因组稳定性和细胞活力。正常体细胞几乎不表达端粒酶,而85%以上的癌细胞会激活端粒酶,使癌细胞保持无限增殖的能力。端粒酶作为一种重要的肿瘤标志物,发展快速灵敏检测其活性的方法有助于癌症诊断和抗癌药物筛选,设计端粒酶活性响应的治疗方法能提高癌症治疗的特异性。近年来,DNA纳米探针以其可编程性、易于修饰和刺激响应性吸引了越来越多的研究关注。
近几年来,随着“三网融合”“宽带中国”政策的推进,电信与广电打破行业壁垒,实现宽带与电视双向进入,电信、移动、联通IPTV及OTT分流电视业务,广电则进入宽带通信领域,并成为5G时代的第四运营商;面对普客市场急剧萎靡的严峻发展态势,各地广电运营商纷纷加快转型升级,寻求破局之路。按照“帕雷托效应”,即20%的集团客户、重要客户贡献些企业80%的利润,现在中国各大运营商都已经意识到集团客户是企业重要的
船舶航行的过程中,由于船体附近流态的变化,引起船体表面压力分布不均,进而造成船体的升沉,在受限水域中,船体附近水面上升或下降,将影响船舶的操纵性能,船体的下沉和纵倾现象与无限水域相比会更为明显,严重时可能造成擦底或搁浅,尤其在港内航行时,如果不充分考虑下沉量的影响,将会存在很大的安全隐患。近几年来,船舶向大型化和高速化发展,现代船舶在受限水域中航行下沉量会增大,如对下沉量的估计不足,将会导致擦底、
企业盈余管理不仅降低了会计信息质量,还严重损害了资本市场的健康有序发展。如何有效规制和监控盈余管理是大家关注的重要问题。已有研究指出,公司治理结构缺陷是制度层面盈余管理出现的根源,因此有必要从公司治理结构入手,探讨其对盈余管理的影响,以期为提高公司会计信息质量、规避盈余管理行为等提供有益参考。现有研究指出,公司内外部治理机制相互关联,因而抑制盈余管理仅依靠内部机制约束是不够的,需要内外部机制共同发
伴随着中国经济发展和中国居民消费水平的提高,中国的啤酒市场也在进行消费升级,目前的竞争格局是低端市场日趋饱和且竞争激烈,即使提高市场占有率,利润仍非常有限.无论是国内啤酒厂商还是外资品牌均在寻找高端啤酒的破局之路,各个品牌均在高端市场发力,推出了各自的高端产品。奥古特作为青岛啤酒的高端子品牌,有着极好的质量口碑,但同样面临着来自各方面的竞争压力。为了可以更好的适应产品和市场竞争需求,奥古特应从战略
滚珠丝杠副精度保持性是高档数控机床的重要性能指标。国产滚珠丝杠副产品在精度保持性方面与国外同类高档产品存在着比较大的差距,严重制约了国产高档机床的发展以及现代化
农村水利PPP项目作为我国水利项目的重点,既能解决政府融资问题,又能尽快落地农村水利项目,解决农村的水生问题,在我国发展迅速。但当前PPP物有所值评价方法存在不足,将影响
全球化的不断深入与科学技术的飞速发展,让转基因食品逐渐走进大众视野。近年来,随着人们对转基因食品的了解不断增多,对转基因食品安全性的争议也成为公众们关注的焦点。而新闻媒体既是公众获取信息的渠道,也是公众参与交流的平台。因此,不同媒体的报道方式在一定的新闻框架中也会呈现出多种报道形态。本文选取《科技日报》和澎湃新闻网,就转基因食品相关新闻报道的框架进行分析,比较分析不同媒体对转基因食品议题的不同报道