基于扰动和矩阵分解的链路预测研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:zhaochunyang2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
复杂网络领域中,链路预测是其中一个关键的研究方向。链路预测就是根据网络的已知拓扑信息去预测网络中丢失的连边、潜在的连边或在未来某一时刻将会出现的连边,甚至可以找出网络数据集中错误的连边信息。目前,科学家针对链路预测问题提出了不同的算法。基于节点相似性算法分为基于局部信息的相似性算法和基于全局信息的相似性算法,局部相似性指标使用网络中局部邻居和结构信息进行相似性大小预测,计算复杂度低,准确度低;全局相似性指标是利用网络中较多的信息,预测的准确度高,计算复杂度高。基于机器学习的方法中常用Deepwalk和Node2vec,以及无监督学习中的聚类算法等。扰动方法中有SPM结构扰动方法,该方法通过固定特征向量,改变特征值达到扰动的效果。本论文针对一些经典算法的不足提出了三种基于结构扰动的算法,将传统的相似性指标与SPM结构扰动、DPC聚类以及Node2vec方法结合起来。本文的主要工作有以下几点:(1)基于扰动的节点特征值峰值聚类链路预测算法。SPM算法可以恢复网络部分缺失信息,DPC算法能够识别噪声点并去除噪声,因此我们将两个算法结合。SPM使用扰动方式恢复部分缺失的信息并得到重构网络;使用重构网络中的信息获取网络的节点中心性指标作为的特征,分别为度中心性、介数中心性、接近中心性和特征向量中心性,特征用于计算DPC算法中的距离矩阵;DPC聚类算法根据局部密度和相对距离找出并去除噪声独立点,弱化噪声。大部分网络在经过扰动和聚类之后,比单独使用其中任何一种算法以及部分相似性指标的预测准确度都有所提高。(2)基于扰动和相似性的峰值聚类链路预测算法。上一个工作中我们仅使用节点的四个中心性特征值,使用的网络信息不全面,在该方法中我们采用相似性指标对这一问题进行改进,将经典指标融合作为连边的特征向量。该算法采用第一个工作中的方法,直接作用于网络的邻接矩阵,利用矩阵的理论知识对其重构,恢复网络缺失的信息;利用重构的拓扑信息对网络进行社区分类并去除噪声。两个算法中我们给出有向网络、无向网络以及加权网络不同的处理方式。该算法在一些真实的网络数据集上得到验证,比第一个工作得到的预测准确度更高。(3)基于扰动和矩阵分解的Node2vec算法。本算法是通过机器学习和经典指标结合的方式,通过对目标矩阵分解,得到网络的表示矩阵作为特征矩阵,预测网络连边的相似性分数。受SPM算法的启发,使用部分相似性指标得到网络的相似性矩阵,循环的将部分已知信息加入到相似性矩阵以达到扰动的效果并得到重构矩阵,重构矩阵中的元素与Node2vec算法的转移矩阵中对应元素相乘,作为目标函数中的邻接矩阵相对应位置元素;目标矩阵使用奇异值分解得到节点的特征矩阵,两个节点特征向量之间的余弦距离作为连边的存在概率。该方法与仅使用的相似性指标或直接使用原始网络邻接矩阵相比,预测连边的准确度高,这也为链路预测提供了一个新的方向。
其他文献
我国是一个农业大国,全国各地不同的水土环境造就了一大批名优特色农产品。文冠果在我国农产品种植领域中十分稀有,作为木本油料树种,该树种在能源和食药,以及生态、人文等领域有着广阔的发展前景。RH公司作为河北省邯郸市生产文冠果产品的龙头企业之一,2019年获得国家地理标志农产品,2021年RH公司文冠果产业产值达3500余万元,发展势头迅猛,形成了较为完整的文冠果产业发展链条,但该公司文冠果产品竞争力不
学位
人体下肢康复是康复医疗的一个重要分支,旨在协助患者完成重复性的下肢运动训练,恢复其一定的行动能力,提高患者生活质量。在患者治疗过程中主要涉及下肢数据采集和康复训练两部分。本文首先提出一种非接触式的人体数据采集系统,采集得到的数据可用于指导下肢运动障碍患者康复训练。然后对索驱动下肢康复机器人的轨迹跟踪控制进行研究,并设计实验验证研究内容。论文的具体研究内容如下:提出一种基于计算机图像和Open Po
学位
我国经济在快速发展的同时,对各种货物的运输需求量也有了较大幅度的增长,但同时也出现了铁路运输占比持续降低且下降幅度持续扩大、公路运输独占鳌头的现象。大量的公路运输导致氮氧化物、颗粒物等污染物的排放量居高不下,而铁路单位货物周转量的能源消耗和环境中污染物排放量与公路运输方式相比非常低。且铁路运输方式的成本低、污染小,因此增加铁路货物运输量不仅可以减少交通运输行业对大气污染物的排放,还能够从源头节约运
学位
近年来,高光谱遥感技术的快速发展使得其在越来越多的领域得到应用,而高光谱图像分类是其中一个重要的分支。对高光谱图像进行有效的分类有利于地物信息分析,这一技术在农业、军事、地质等领域都有着广阔的应用前景,但机理复杂、数据量大等缺点也制约着高光谱图像分类技术的发展。高光谱图像的分类过程存在较多的困难:光谱特征具有非线性特征;相邻波段间具有相关性;训练过程中需要大量的标注的数据来进行训练,当具有标签的训
学位
随着深度神经网络的发展,基于全监督的语义分割方法在近年来不断取得突破进展,然而全监督的语义分割方法过度依赖于密集像素标注,这类标注信息需要高昂的时间与人工成本。为了降低语义分割任务对于标注信息的强依赖性,基于弱监督的语义分割方法逐渐受到了人们的关注。该类方法通常采用较为容易获取的标签,例如边界框标签,涂鸦标签,和图像级标签等。在这其中,图像级标签因为制作成本较低而被广泛使用。基于图像级标签的弱监督
学位
遥感影像变化检测旨在从多时相遥感影像中确定与获取感兴趣的地物要素变化,这在城市规划、环境监测、经济发展、国防建设等领域有重要的应用。深度学习为遥感影像变化检提供了新思路,它能够从多时相影像中自动学习特征,高效准确地提取变化信息。然而,基于深度学习的变化检测方法存如下问题:变化信息较少,相对大场景中的非变化信息是稀疏的,标注数据类别间存在不平衡;需要手工标注大规模数据集进行训练,标注成本极高。本文围
学位
近年来,由于网络的迅速发展,复杂网络变得越来越难以有效的检测,不仅是因为网络的规模的骤增,还因为网络中的节点包含着丰富的内容。另外,网络的节点也不在仅仅处于一个社区内,还有可能与多个社区有所联系。因此,对于重叠社区和属性社区的检测,是本文所研究的重点内容。如何从复杂的网络中识别关键的信息,发现其社区结构,有着极其重要的现实意义。社区结构作为复杂网络的一种重要特征,对于理解整个网络的结构特性、节点功
学位
目的通过诊察并对比多囊卵巢综合征患者与健康女性小腿段足三阴经的阳性反应,观察多囊卵巢综合征患者足三阴经的经络腧穴反应现象。方法以18-35岁的40例多囊卵巢综合征患者(多囊组)和35例健康女性(健康组)为研究对象,应用传统经络诊察法和人体压痛力学定量测试仪,分别于PCOS组和健康组的非经期诊察双侧小腿足三阴经阳性反应物(条索、结节、松软、凹陷等形态异常)及压痛的出现情况、以及测定压痛VAS值及压痛
学位
基于快速搜索和发现密度峰值的聚类算法(Clustering by Fast Search and Find of Density Peaks,DPC)被提出以来,由于其思想简单,所需参数少,聚类高效等优点被广泛应用。然而,随着对DPC算法的深入研究,一些问题和不足也逐渐暴露出来:截断阈值(9((8)难以确定、聚类中心难以准确选择、样本划分易导致连带错误、对具有复杂流形结构、类簇之间密度差异较大数据
学位
近年来,因为人类的步态即使在远距离低分辨率下也具有很强的辨别能力,所以步态识别越来越受到人们的关注。但不同视角下行人的步态图像序列差异较大,因此步态识别的性能易受到视角变化的影响,影响最终的识别率。针对这一问题现有的算法主要分为以下三类:步态能量表征模板、提取视角不变性特征、学习不同视角下的映射关系。而本文提出了利用图卷积网络来解决由视角差异引起的识别率低的问题。本文的主要工作和创新点如下:(1)
学位