复杂网络链路预测算法研究

来源 :兰州交通大学 | 被引量 : 0次 | 上传用户:woheni187170713
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机科学技术的快速发展,各个领域的复杂关系产生了多个复杂网络,比如:社会网络、信息网络、生物网络和技术网络。链路预测是复杂网络中重要研究内容,它是在给定网络中利用已有的各种信息来预测尚不存在连边的两个节点发生链接的可能性,在社会网络中的朋友推荐系统、预测蛋白质之间的相互作用、推断网络演化机制等领域均有广泛应用。经典链路预测算法大多是从网络的拓扑结构包含的信息出发研究的单机制算法,但这些算法的预测精度具有局限性并限制了适应范围。为了解决以上问题,近些年,提出了融合集成思想的混合链路预测算法。因此,本论文基于单机制算法和混合算法对链路预测问题展开研究,主要内容如下:(1)单机制链路预测算法。针对目前已有的基于网络拓扑结构提供信息的链路预测算法,在不增加计算复杂性的前提下有效地度量网络的结构信息是一个难点,因此引入本地网络概念提出了一种基于相对熵和节点局部结构的节点结构相似性链路预测算法。为防止引入过多的噪音信息,使得预测准确率下降,首先,通过定义二阶本地网络刻画节点的局部结构;然后,利用相对熵的方法重新定义了节点之间的结构相似性;最后,提出基于相对熵度量节点结构相似性指标的算法。在7个真实数据集上实验测试表明,相比其他相似性指标,该算法在曲线下面积(AUC)衡量标准下可以获得更好的效果和更稳定的性能,也表明此算法适用于平均聚集系数小的网络并且在大规模网络上有较好的表现。(2)组合规则法的混合链路预测算法。针对链路预测组合算法的精确度一定优于每一个单机制算法的精确度的观点,提出一种基于信息熵改进主成分分析模型的混合链路预测算法。首先,用随机森林确定7个相似性索引(CN、LP、LHNII、ACT、Katz、SRW和MFI)作为最佳特征集合;然后,根据组合的思想将7个相似性指标组合在一起提出基于信息熵改进主成分分析的特征信息融合模型;最后,对特征信息赋予权重,与单机制算法结合提出混合链路预测算法。在6个真实数据集上实验测试表明,相比其他单机制算法和混合链路预测算法,该算法具有更好的稳定性和准确性。(3)拟合学习法的混合链路预测算法。针对使用集成学习技术提高链路预测的准确性仍有进一步探索的可能性,提出了一种基于集成学习的混合链路预测算法。首先,分析单机制方法,将11个相似性索引(CN、AA、HDI、HPI、RA、PA、LP、Katz、LHNII、ACT和MFI)分成4大类(基于共同邻居、基于路径、基于随机游走和基于矩阵森林指数)提取网络特征用于堆叠模型,结果表明预测效果不佳;然后,组装了11个相似性索引作为复杂网络的特征集,并用“Pearson r和SVM-RFE”的组合策略选取适用网络的最佳特征;最后,分别在袋装和堆叠模型中集成4个分类器用于混合链路预测。在6个真实数据集上实验测试表明,相比其他链路预测算法,该算法具有更好的稳定性和准确性。
其他文献
图像描述任务的目的是计算机自动生成图像的描述性语句。近年来,图像描述技术获得人们的广泛关注,主要原因包含两个方面:一方面,图像描述技术有着广阔的应用前景,例如盲人导航、智能监控、儿童早期教育等领域;另一方面,图像描述是计算机视觉和自然语言处理的跨模态技术。因此,这要求计算机不仅识别图像中的主要实体及其属性,联系实体间的关系,还要用自然语言描述出来。目前,图像描述的主要研究方法是基于深度学习的编码器
学位
多环芳烃(Polycyclic aromatic hydrocarbons,PAHs)是石油的重要组成成分之一,具有显著的致癌、致畸以及致基因突变特性,对生态环境和人体健康构成严重威胁。作为我国第二大石油产区,胜利油田的开发建设对黄河三角洲地区产生直接影响,因此本研究通过野外采样分析了黄河三角洲内陆荒地土壤、滨海滩涂沉积物与潮沟水、自然保护区内外以及不同年份下16种优先控制的PAHs污染特征,探讨
学位
在全球气候变化背景下,两栖物种的灭绝风险不断上升。横断山区是我国两栖物种较丰富的地区,同时也是我国两栖物种的主要保护空缺区之一。当前两栖物种在横断山区的分布状况并不明朗,气候变化对区域内珍稀濒危两栖物种分布的潜在影响也亟待发掘。本研究基于横断山南生物多样性保护优先区内2019年至2020年两栖动物的实地调查数据,利用优化后的Maxent模型和KISSMig模型,预测在物种最大迁移速率分别为0.5
学位
二型花(dimorphic flower)作为一种植物中广泛存在的多态性,由相同的基因型产生,是一种独特的表型可塑性的体现,在植物的极端环境适应和生殖保证中起着至关重要的作用,具有很高的生态和进化意义。二型花植物通常拥有两种花朵类型:一种是较大的色彩艳丽的开放受粉大花(chasmogamous flower),一种是较小的且花瓣颜色接近叶片绿色或无色的闭锁受精小花(cleistogamous fl
学位
图论起源于柯尼斯堡七桥问题,与数学联系密切,目前在计算机和数学领域都有很重要的研究和应用。图染色是图论的一个研究点,同样有着广泛应用,尤其适用于组合优化问题的解决。现实中的很多问题都可以抽象成随机图进而利用图染色方法去解决,如地图着色、任务调度、最大支配度、矩阵运算、通信编解码等等。从公开发表的文献中可以看出,目前已有的染色方法和结果只能解决抽象为特殊图或一些点数较少的随机图的现实问题,对点数较大
学位
户外视觉系统通常对天气因素比较敏感,尤其是雾霾和沙尘等。在雾霾和沙尘等恶劣天气下,空气中的浑浊媒质和悬浮水溶胶粒子极大地阻碍了目标场景到成像设备之间光线的正常传输,使得成像设备获取的图像或视频出现了一系列不良现象,例如对比度受损、图像细节丢失、场景颜色偏移和可见度下降等,导致户外视觉系统的工作效能严重降低。因此,随着智能化和视觉系统的发展与需求,对雾霾和沙尘天气下的退化场景实现可见度复原成为计算机
学位
信息技术的不断发展,各个行业会产生海量的文本数据。与此同时,使用自然语言处理相关技术挖掘数据间的联系,潜在的语义关系愈发重要且充满挑战。共指消解任务是自然语言处理领域的重要研究内容,广泛应用于自动问答,文本摘要,阅读理解,知识图谱等领域,具有重要的学术研究价值和商业使用前景。目前,在深度学习框架下的共指消解研究正在成为主流的研究方法,主要集中在如何使用基于句中的词嵌入信息有效识别实体和实体之间的共
学位
近几年,由于非常规突发事件爆发的规模逐渐扩大,严重影响我国经济的快速增长及社会的稳定发展。全世界各类灾害性事件也频繁爆发,并且发生范围持续扩大,以至于传统小规模、未及时处理的常规突发事件逐渐演化为覆盖范围广、恢复极度困难的非常规突发事件。由于非常规突发事件具有不明显性、极度罕见性、十分复杂性、难预知性、巨大破坏性和应对时间紧迫性等特征,一旦非常规突发事件爆发,其产生的衍生灾害事件比常规突发事件更难
学位
单核苷酸多态性(Single Nucletide Ploymorphysim,SNP)位点是研究人类家族、动植物遗传变异的重要基础,因此被广泛应用于群体遗传学、疾病相关基因等研究,并在药物基因组学、诊断学和生物医学中发挥着重要作用。在药物基因组学研究中,识别SNP位点-药物之间的关联关系是临床精准用药的关键。然而,传统的生物实验方法在验证大量SNP位点-药物之间的关联关系时,不仅成本高、效率低,而
学位
近年来,滑坡、泥石流等地质灾害的频繁发生,给人们的生产生活带来了极大的损失。随着航天遥感和无人机技术的发展,地面变化和交通设施可以被全天候实时监视,为人们实时监测和预防灾害提供了有力的技术支持,可以最大限度的保护民众生命和财产安全。图像检测方法可以快速提取出不同时间监测对象的变化情况,已被广泛应用于地质灾害监测、关键设施损伤监测等诸多领域。本文针对多时相遥感图像和桥梁裂缝图像自身的特点,提取图像的
学位