异构网络对齐的关键技术研究

来源 :太原理工大学 | 被引量 : 0次 | 上传用户:zxing515
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术日新月异的发展,网络逐渐为人们日常生活中不可或缺的工具。它是一种功能强大的图结构,可以很自然地捕获海量数据中对象之间的关系。为了获得对象的更多隐含信息,许多图挖掘任务需要联合多个网络的数据进行分析。然而汇聚异构网络中的数据所面临的首要问题是“如何对齐不同平台的对象”。许多下游任务是在对象对齐之后构建的。例如,蛋白质网络的模式匹配、社交网络中的用户身份识别、跨领域个性化推荐和社会链接预测等等。因此,网络对齐在广泛的应用中具有十分重要的意义。本文针对异构网络对齐问题做了以下两个工作:(1)目前,大多数异构网络对齐问题的解决方案可以归纳为以下三个步骤:特征提取、模型构建和节点匹配。第一步,从节点的属性信息和网络结构中提取可用的信息作为节点的特征,标识着节点的身份。第二步,对上一步提取出的特征进行统计或者向量化表示,用作模型构建阶段的输入。然后,根据锚节点对(也即预先已知的对齐节点对)的可用性训练有监督或者无监督模型。最后,利用训练好的模型来预测两个节点身份是否匹配。当前,大多数网络对齐方法在特征提取阶段只重点关注节点的局部结构或全局结构,这种特征提取方式在一定程度上造成节点信息的缺失。因此,本文提出了一种多尺度建模机制,不仅在全局结构上构建了节点的特征,而且从局部结构上加强了节点信息的表达能力,增强了节点特征的丰富性。同时,在模型训练阶段,常常面临计算效率低的问题。为了解决这一问题,本文引入了一种基于QR分解的隐式矩阵分解方法,使用少量的节点即可达到表达全部节点的能力,大大提高了计算效率。(2)隐式矩阵分解方法常常需要筛选出少量的节点,利用这些节点与全部节点建立关联关系,这些筛选出的少量节点被称为地标节点。目前采用隐式矩阵分解方法解决网络对齐问题的模型常常采用随机抽样技术选取地标节点,这种筛选方式将所有节点一视同仁,忽略了地标节点的特殊性和重要性。因此,本文提出了一种基于节点重要性的采样策略。该策略根据节点的重要程度,从全部节点中筛选出最具有代表性的节点作为地标节点,进而构建它们与全局节点的关联关系。本文提出的异构网络对齐算法可广泛地应用于不同领域,例如在实际问题中的社交网络用户匹配、链路预测、用户画像、好友推荐、蛋白质分析、模式识别等等。为了验证本文提出的两种算法的有效性,分别在三个不同类型、不同规模、不同稀疏度的数据集上做了大量实验,并使用三种不同的评价指标从预测角度和排序角度对模型进行评估。实验结果表明,本文提出的两种网络对齐算法具有更优的性能。
其他文献
传统的设施监测手段主要基于压电检测技术,但此技术难以对基础设施的安全进行实时监测。而分布式光纤传感技术以光纤作为传感媒介,可以实现对振动信号的实时解调,具备探测距离长、精度高、本质安全、耐腐蚀等优点,被广泛应用于交通运输、石油化工、周界安防等基础设施领域。相位敏感光时域反射仪(Phase Sensitive Optical Time Domain Reflectometer,Φ-OTDR),作为一
混沌激光广泛应用于安全保密通信、高精度激光雷达和高速物理随机数生成等众多领域。外光反馈半导体激光器因其结构简单和动力学特性丰富等优势成为混沌激光产生的首选光源。然而,随着对光反馈半导体激光器的深入探索,其产生的混沌激光存在两个突出问题:一是不完全随机,机器学习方法的发展和引入使混沌激光的短期预测成为可能;二是存在时延特征,暗含周期性,时延特征的泄露降低了混沌保密通信系统的密钥空间。因此,混沌激光的
光时域反射仪是用于检测光纤故障和光纤连接点损耗的专业设备,由于其具有检测精度高、测量距离远、无损伤探测等优点,已被广泛应用于宽带互联网中的光纤链路检测与维护。光时域反射技术的基本工作原理是依靠分析光纤注入端接收的背向瑞利散射信号和菲涅尔反射信号与传输时间的关系来检测光纤故障特性,如连接点、熔接点、弯折、断裂、光纤损耗等事件。目前,国际上普遍使用的光纤检测技术是脉冲光时域反射技术,但是该技术具有原理
随着时代的发展和社会的进步,互联网开始基本全面普及,网络信息安全性就会变得极其关键。现在是网络时代,网络不安全,国家安全肯定也将会遭受影响。因此网络安全的重要性就自然不言而喻了。在现实中,移动互联网这个看不见摸不着的事物并不风平浪静。银行卡账户信息被盗,个人手机电脑被病毒劫持,成为比特币挖矿机;每天各种网络信息诈骗……现如今各种网上的安全问题让人频频中招。在2016年习近平主持召开的网络安全和信息
我国是一个农业大国,农业用水占总用水的60%以上,长期以来粗放式灌溉造成了大量的水资源浪费。为了提高用水效率,现代农业必须大力发展精准灌溉技术,更加精确的控制灌溉时机和水量大小。因此实现高精度、长时间的土壤水分监测,掌握土壤水分的变化规律是制定科学灌溉方案的重要依据和必要前提。然而目前传感器高成本与高能量需求限制了传感网络的大范围、高密度应用。针对这一问题,本文首先通过有限元法对传感探针的结构参数
随着互联网、人工智能等新兴产业发展,电信行业从网络到业务都发生了巨大的变化,人们对于通信方式和通信质量提出更高的要求,城域网作为电信运营商的承载网,其建设和优化对城域网业务的发展起着至关重要的作用,因此如何进一步扩大数据城域网的网络规模,同时合理构建未来数据城域网架构,以保证未来网络承载能力成为一个需要深入研究的问题。本文对地区城域网建设和优化方案进行了研究。首先对本地城域骨干网和接入网、基础资源
近年来我国人民生活水平的日渐提升,很多人的生活习惯开始向不健康的方向发展,导致我国心血管发病率的不断攀升。通过我国初级卫生保健检查中的心音听诊,如能检测到主动脉狭窄等现象,则可以将患者归为心血管疾病发病初期的疑似病例,在此基础上,提早开展心血管疾病的预防治疗,可以提高患者的知情率以及治愈率。我国幅员辽阔、医疗资源相对短缺,采用医生和患者一对一模式展开心音听诊是非常消耗医疗资源,而且听诊结果也会受到
云计算是一种基于即用支付收费模式(Pay-as-you-use)的计算服务,与传统IT服务模式相比,它能够保证用户需求的即时性。其中,用于规范服务并且保障双方权益的云计算服务等级协议(Service Level Agreement,SLA)得到广泛关注。简单来说,SLA是服务提供商与用户之间确立多方面要求的合同或协议,这其中包括服务等级目标(Service Level Objective,SLO)
每当翻开这本小小的,但放在掌心极其有分量的书,都会让人情不自禁地陷入书中所描绘的那片晚霞笼罩着的田野里。这是一片需要反复遨游的田野,每一次的闯入和离开,都会收获不一样的感受与回味。驻足平凡而又艰苦的生活,偶尔找一个阴天的午后,寻两三个小时的闲暇时光,去一口气读完一位老人完整的一生,是对生活的“解毒”,也是对生命的敬畏。《活着》是在一个广阔而苍凉的背景下展开叙述的,但小说有意淡化了那些特定的社
期刊
近年来,越来越多的对抗攻击技术被提出,在计算机视觉、自然语言处理等领域,研究者们纷纷探究如何利用其来攻击现有的基于机器学习或深度学习的异常检测、分类等系统,旨在评估相关技术系统的健壮性,以及进一步推动防御方法的提升。然而在物联网安全领域,无论是研究学者,还是黑客攻击者,针对对抗攻击的研究还都处于初级阶段,因此,本文从攻击的角度出发,通过深入探究对抗攻击技术在物联网安全方面的应用来补充现有研究在这方