关系图表示学习与多图融合方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:jiguoqiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关系图是指数据对象之间存在拓扑结构的数据,通常这样的数据对象也称为节点,拓扑结构则称为关系。随着计算机科学与互联网的快速发展,蕴含内在联系的关系图数据普遍存在。例如,社交网络中用户与用户之间存在好友关系、物理系统中研究对象之间具有内在联系、蛋白质之间的交互网络、语义网络中的知识图谱和许多其他领域数据。将数据对象抽象为节点,利用关系图刻画不同数据对象之间的联系,可以帮助人们更方便地理解数据的内在含义和挖掘其潜在价值。由于互联网存在大量的关系图数据,使得分析和挖掘关系图相关应用得到越来越多的关注,并逐渐成为一个国际上的研究热点。在真实应用场景下,关系图数据结构通常比较复杂,其可能存在多个图的情况,并且拓扑结构也不仅仅用单关系所能描绘。具体地,其复杂性主要体现在以下两个方面:关系多样性以及多图性。因此,本文以具有复杂结构的关系图数据为研究对象(包括单关系图与多关系图),分别围绕表示学习与多图融合两个问题逐步展开研究,并提出相应的解决方法。本文的主要研究内容和创新概括如下:(1)针对单关系图表示学习中的单关系属性图的表示学习问题,本文提出一种基于两级变分自编码器的单关系属性图的表示学习框架TLVANE。该框架利用Doc2Vec对文本属性进行表示学习,然后结合节点的邻接向量,进行端到端的深度变分自编码学习,以生成节点的低维稠密向量。该框架具有两级变分自编码过程,其中第一级变分自编码过程代表融合文本属性与拓扑结构的隐向量,第二级则分别生成前述两个特征的隐向量。通过编解码过程,TLVANE算法能够学习节点的跨模态特征,同时捕捉数据的高度非线性结构。最后,在三组具有文本特征的数据集上验证了TLVANE算法的优越性和有效性。(2)针对多关系图表示学习中的多关系图卷积网络问题,本文提出一种基于泛化张量积的多关系图卷积框架MR-GCN。通过对三维张量积进行推广,本文提出一个基于泛化张量积的多关系图卷积算子MR-GCO。具体地,给定一个无向多关系图的邻接张量,计算其对应的拉普拉斯张量。然后,对拉普拉斯张量进行张量特征分解,得到张量变换特征基。最后,类比传统的谱图卷积过程,利用张量变换特征基,进行谱域的卷积操作。由于该卷积操作直接定义在多关系图上,因此能够挖掘关系之间的内在关联性。因为张量特征分解以及多关系图的谱域卷积过程,均定义在张量积的基础上,同时张量积的计算方式又适用于任意酉变换,所以该多关系图卷积算子具有泛化性。通过与先进的基线算法进行对比,在四个现实世界的数据集上,实验结果都验证了所提出的MR-GCN算法的有效性。(3)针对面向单关系图的多图融合的跨网络节点对齐问题,本文提出一种基于内部与外部注意力机制相融合的跨网络节点对齐模型INAMA。该模型同时考虑拓扑结构与节点属性信息,将跨网络节点对齐问题转化为一个分类任务。首先,为了高效地利用拓扑结构信息,该模型定义了匹配近邻来替换原始拓扑结构,以保持局部网络一致性。其次,为了区分节点信息在本地拓扑结构和跨网络结构中传播的影响,该模型分别引入内部与外部注意力机制。然后,利用二分类的深度神经网络,将跨网络节点对齐问题转化为二分类问题。最后,通过与先进的基线算法进行对比,在六个真实世界数据集上,实验结果验证了所提出的INAMA算法的有效性。(4)针对面向多关系图的多图融合的跨知识图谱实体对齐问题,本文提出一种基于知识感知图注意力网络的跨知识图谱实体对齐模型KAGNN。该模型能够蕴含保留原始语义的知识事实,同时能够合理有效地利用复杂关系网络。首先,为了对知识事实进行有效的建模,提出基于知识感知的注意力机制,该注意力机制能够自动识别每条知识事实的重要性。然后,为了对复杂关系网络进行合理的表示学习,采用含有Highway Gates的图卷积网络。通过含有Highway Gates的图卷积网络,能够捕捉高阶近邻信息,同时减少隐藏层之间的噪声累积。最后,通过与先进的基线算法进行对比,在三组真实世界的跨语言知识图谱数据集上,实验结果验证了所提出的KAGNN模型的有效性。
其他文献
将再生粗、细骨料混凝土置于钢管中,形成钢管再生粗/细骨料混凝土柱,可利用组合构件的力学性能优势有效弥补再生混凝土的力学缺陷,在多层及小高层结构中具有广阔的应用前景。钢管再生混凝土的约束机理复杂,再生混凝土材料自身具有高离散性,建立精确且具有普适性的钢管再生混凝土力学性能预测模型与设计方法,是制约该类新型结构工程应用的瓶颈式难题。目前,国内外学者已对钢管再生粗骨料混凝土的力学性能进行了较为系统的研究
学位
汽车悬架系统是连接车身与车轮弹性装置的统称,随着汽车工业技术不断发展,主动悬架系统因其优越的衰减车身振动性能,成为汽车悬架系统的发展趋势。然而,由于主动悬架系统结构设计复杂且包含多个执行机构与多种类型传感器,系统机械结构与元器件由于长时间使用或老化易发生故障,降低了主动悬架系统甚至整车的控制性能、可靠性与安全性。主动悬架的可靠性问题是限制主动悬架广泛普及的重要因素之一。因此,关于主动悬架系统故障诊
学位
采用正交层板胶合木(CLT)制作楼、屋盖构件和剪力墙的多、高层木结构称为正交层板胶合木结构。正交层板胶合木及结构体系的研发可追溯到20世纪90年代,本世纪第二个10年中期始纳入各国木结构设计标准,也包括我国木结构设计标准GB 50005—2017。正交层板胶合木组坯方式多变,其层板的材质等级、层板的几何尺寸和层数的选择自由程度很高,因此正交层板胶合木构件和连接的承载力和刚度计算较均质材料是更为复杂
学位
随着物联网快速发展,传统地面网络难以满足未来物联网的全球广域接入需求。低轨卫星网络具有可全球覆盖、低传播时延和低成本的优势,以低轨卫星网络作为地面网络的补充,构建低轨卫星物联网,实现全球万物互联互通是必然趋势。然而,由于低轨卫星网络星地链路受多径衰落、多普勒频移等影响,以及星地网络的频谱资源的限制,对低轨卫星网络星地链路的多址接入方法、译码方法、信道建模等方面提出更高的要求。本文以低轨卫星物联网为
学位
斜拉桥索(以下简称为斜拉索)是风敏感结构,涡激振动、干索驰振、风雨激振等典型斜拉索风致振动可引发结构疲劳损伤甚至直接破坏,影响结构安全与使用寿命。流动控制是提高斜拉索抗风性能的重要手段。传统的流动控制措施通常产生于对斜拉索二维流场机制的探讨,缺乏对斜拉索绕流场三维流动特征的分析。而控制高效、装置简单且成本低廉的斜拉索风致振动三维流动控制方法的提出有赖于斜拉索三维流场的流动机制研究。因此,本文以掌握
学位
数据,作为新一代生产要素,已成为各个企业和国家具有战略价值的重要资产。由于数据只有流动与共享才能更为充分地发挥其价值,寻求跨企业、行业、领域的多方数据合作计算,已成为当前企业的刚性需求。但数据价值的重要性愈加凸显,这种合作计算模式引发的数据泄漏与滥用所导致的负面影响和经济损失也越大。因此,如何实现多方数据的安全合作计算成为亟待解决的重要问题。利用安全多方计算技术,构造安全多方计算通用协议,以实现任
学位
波纹钢结构具有施工速度快、工程造价低、耐久性好等优势,在公路管涵、隧道、综合管廊和防护工程中得到广泛应用。其中,综合管廊、地下隧道等应用场景为充分利用空间,更适合使用浅拱形(矢跨比小于1/5的拱)波纹钢结构。随着结构逐渐向大跨度、高负荷方向发展,现有波纹钢结构的稳定问题逐渐突出,在承受较大荷载时可能发生结构失稳。本文提出了一种波纹钢-钢筋混凝土组合浅拱构件,其截面刚度大幅提高,可有效改善波纹钢结构
学位
近年来,尤其伦敦千禧桥事件之后,人与结构相互作用(Human-structure interaction,HSI)问题引起研究者的广泛关注。在该事件中,人群步行导致的桥面大幅度振动造成人群恐慌。许多学校建筑在汶川地震中发生严重损伤甚至倒塌,其时正值学生位于教室,人群荷载大,这引起了对紧急疏散行为在结构失效中所起作用的关注。为量化评价人与结构相互作用的影响,本文提出了适用于大幅度振动环境下奔跑和步行
学位
膜结构由于其新颖多姿的外表形式和清晰高效的传力方式,近年来得到越来越广泛的应用。但是在膜材的制造、运输、安装和使用过程中,不可避免地会出现初始缺陷,而缺陷附近的应力集中使得膜结构在低应力水平下就可能发生撕裂破坏,因而撕裂破坏是膜结构的主要破坏模式,膜材的抗撕裂性能对于膜结构的整体安全性至关重要。然而,由于对膜材撕裂机理的认识还不够深刻,各国的膜结构设计规范都没有关于膜材抗撕裂性能的规定条文,目前的
学位
应变硬化纤维增强水泥基复合材料(Strain Hardening Cementitious Composites,SHCC)是一种具有超高韧性的纤维增强水泥基复合材料,这种材料在承受荷载后会表现出独特的多缝开裂的破坏模式,因而具有了优异的变形及能量吸收能力,同时可控制的裂缝宽度使其获得了远超普通混凝土的耐久性能。因此,SHCC广泛应用于建筑结构工程,道路工程,水利工程,军事防护等诸多领域。随着科技
学位