基于传递相似性的复杂网络链路预测

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:krizy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
复杂网络是研究复杂系统的有效工具,真实世界的复杂系统是随着时间变化的,因而对应的网络也在变化,刻画这种变化的网络就需要对边的变化进行预测,即链路预测问题的研究。按照网络的边是否随时间变化,可以将网络分为静态网络和动态网络。相关的链路预测方法也不同。静态网络链路预测认为,在当前已知数据条件下,网络中现有的边在未来的短时间内不会发生变化,而目前不存在的边在未来中可能出现。链路预测在实际应用和理论研究中都有重要的经济以及理论价值。现有的静态网络链路预测方法按照其思想主要可分为基于拓扑结构的方法、基于马尔科夫理论方法以及基于概率似然理论的方法等三大类。其中,以共同邻居和资源分配(Resource Allocation,RA)方法为代表的基于局部拓扑结构信息的方法计算复杂性较低、容易理解,比较适合处理大规模网络数据。然而,此类方法只使用了拓扑上最邻近的结构信息,对于拓扑上更远的结构信息并未考虑,限制了其预测的性能。本文改进了资源分配方法,将其和传递相似性整合,提出了基于资源分配的传递相似性(Transferring Similarity based on Resource Allocation,TSRA)链路预测方法,并考虑到该方法需要计算逆矩阵的不足,提出了由该方法改进的基于资源分配的传递结构相似性(Transferring Structure Similarity based on Resource Allocation,TSSRA)链路预测方法和基于资源分配的多步传递相似性(Multi-step Transferring Similarity based on Resource Allocation,MTSRA)链路预测方法,这两个方法克服了基于资源分配的传递相似性方法需要矩阵求逆的不足。由于考虑了两节点之间的中间节点对节点对相似性的贡献,相比于资源分配方法,新方法更充分的利用了节点对路径上中间结构信息。实验结果表明,新方法在保持方法低时间复杂度的同时,提高了链路预测的准确性。针对链路预测问题,本文用链路预测领域常用数据集对新方法的特性进行了详细的实验研究,并且和资源分配方法在多个网络数据集上按照多种不同的评测标准进行了预测性能的综合比较分析。实验结果表明,本文提出的基于资源分配的传递结构相似性方法在Router以及Power等数据集上得到的AUC比原有的RA方法提高了0.06左右,在Yeast以及Celegans等数据集上的AUC提高了0.03左右。基于资源分配的传递相似性方法则相比于资源分配方法主要在Power数据集上AUC提高了0.06左右,在其它数据集上则提升不明显。基于资源分配的多步传递相似性方法也是主要在Router以及Power数据及上有0.04左右的提高。
其他文献
自德国科学家马克斯?普朗克在二十世纪初第一次提出光量子假说,量子力学距今已有百年历史。随着对量子力学不断的了解和研究,人们可以发现量子力学中的一些基本原理以及特有
有限集交族是组合数学的一个重要分支,研究的是[n]={1,2,…,n}的子集族在满足特定性质下,其元素个数的上界问题.对有限集交族的研究方法主要有关联矩阵法,几何半格法,多重线
本文首先概述了估计函数的发展经历,介绍了已有的估计函数相关理论,及其在单参数时间序列中的应用,引进估计量的概念。近年来很多学者的兴趣集中在经济金融领域的估计函数理
进料加速器是卧式螺旋离心机的一个关键部件,主要功能是将进料管中的物料输送至离心机转鼓内。但某厂在使用LW350卧式螺旋离心机处理铜矿浆物料时,由于固体颗粒的撞击造成了加速器内壁严重磨损,导致结构失效。为此,本文针对加速器内流体运动状态及流动特性进行了研究,分析加速器的磨损原因,并提出了加速器优化设计方案。设计并搭建了加速器高频图像实验系统,主要包含加速器实验主机、高频时序同步系统、流场荧光示踪系统
染色质重塑因子是一类重要的表观遗传学调控因子,它们依赖ATP水解释放的能量,以蛋白质复合体的形式对染色质结构动态调控。INO80(Inositol auxotroph 80)是其中一类因子。IN0
传统的对长杆稳定性的研究没有考虑初始缺陷的影响,本文在传统研究的基础之上重新考虑初始缺陷这一因素对长杆稳定性的影响。对此分别按照传统研究方法和考虑初始缺陷时对曲
本文利用三维变分方法对热带风暴、飑线和层状云降水等多种不同类型的降水过程进行风场反演,并与双多普勒雷达风场反演结果、风廓线雷达探测结果及原始径向速度等数据进行对
青藏高原地形复杂,缺乏地面观测站点,卫星遥感的手段成为获取高原降水信息的主要方式。为了准确获取青藏高原地区降水的时空分布信息,本文在分析了几种降水测量技术在青藏高
本文对几类特殊重要的自相似网络的谱性质及其在生成树、随机游走或陷阱问题中的应用进行了研究。大量的文献表明网络的特征谱与网络的拓扑性质密切相关,而生成树、随机游走
生物测序技术是分子生物学研究中的基础技术,用来测定生物基因序列组成。测序工程中产生海量的生物数据,数据规模呈指数级地快速增长。如何存储,处理和分析这些生物数据是大