面向属性网络表示学习方法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:liwl11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息时代下大数据的快速发展,实际生活中的数据规模呈现指数级别的增长并对人类的生产和生活产生了根本性的变革影响。数据进一步紧密相互关联并以多种的网络结构形式广泛存在于人们的实际应用中,因此如何从结构化关联图结构数据中挖掘潜在的复杂关联规则并建模演化预测模型对国家与社会的发展有着重要的意义。随着网络规模维度的不断增长,传统网络分析模型受限于庞大的模型存储和计算开销的限制而无法得到灵活运用。不同于传统方法,网络表示学习目标将网络中的节点映射到低维的向量空间中来进行有效地网络分析任务,并在不同应用上验证了其性能的有效性和模型的高效性从而受到研究者们广泛的关注。其中属性网络则是在不同应用中广泛存在的一种通用图数据形式,本论文则分别针对属性网络表征面临的节点属性稀疏性及表征融合耦合性、节点语义多面性及向量表征单一性和节点向量空间表征的局限性等研究挑战,重点对面向稀疏属性网络的网络表征学习、多面性条件属性网络表征和双曲属性网络的向量表征三个方向展开研究工作。具体地,本论文的主要研究内容和贡献总结如下:首先,针对节点属性稀疏性和表征融合耦合性的挑战,提出面向属性网络中属性稀疏和解耦融合的表示学习方法。基于具有相似网络结构和属性信息的节点具有相似向量表征基本假设,本文首先提出了基于截断式随机游走的稀疏属性网络表征模型来融合节点的网络结构和属性来得到综合的向量表征,通过将节点和属性投影到低维的向量表征空间中并引入结对式方法来捕捉节点和稀疏属性之间的交互关系,同时汇聚相邻节点的属性信息来进一步缓解稀疏性从而来得到一个更好的节点向量表示。随后,引入注意力机制来衡量相邻节点和中心节点的权重关系并通过最大化周围节点预测中心节点概率来维持网络结构信息。另一方面,为了分别建模属性网络中结构等价性和同质性相似性的不同,本文提出了解耦式属性网络向量表征,设计了两个图卷积核模块来分别捕捉网络结构和节点属性相似性,并提出自适应融合函数根据节点自身特性得到融合后的向量表征,利用改进后的小批量样本训练方法迭代汇聚高阶的节点和属性信息来高效生成节点向量表征。最终在多个数据集上对比最新的研究工作,本文提出的模型在多标签节点分类和链接预测任务上实现了显著的性能提升,在不同节点属性稀疏的比例下具有良好的鲁棒性。其次,针对节点语义多面性及向量表征单一性的挑战,提出多面性条件属性网络向量表征方法。传统的网络网络表示学习方法为节点只学习到单一的向量表示从而难以表征节点间的多面性语义相似性。本文提出了一个端到端的图卷积框架来为节点学习多个条件向量表征,从而来捕捉节点在多个语义上的不同相似关系。首先设计了一个二值掩码层将单个节点的向量表征拆分成多个语义对应的条件向量子空间,引入了注意力网络来建模节点之间多语义的复杂交互关系,同时提出了多面性的消息-传递-接收机制来捕捉高阶节点之间的多面性语义信息,并基于贝叶斯个性化排序准则和多任务学习框架来联合学习多个节点条件向量表征。最终本文提出的模型在节点推荐任务上实现了显著的性能提升,并通过节点表征可视化和模型迁移实验证明了具有良好的解释性和鲁棒性。最后,针对节点向量表征空间的局限性的挑战,提出多面性双曲属性网络的向量表征方法。基于非欧式的图结构数据中存在的潜在层次结构属性,本文提出了基于双曲空间的多面性图卷积神经网络框架来分别捕捉多面性节点影响力和偏好相似性。具体地,本文首先依据节点的属性将其表征到双曲向量空间中来维持数据中潜在的层次结构关系,通过双曲空间的向量操作定义推导出多面性的消息传递接收机制来捕捉节点之间的多面影响力,然后基于双曲距离提出了自适应的双曲度量准则来计算节点之间的相似关系。在多个公开数据集上的实验结果表明,本文提出的模型不仅能够学习节点之间网络属性并同时维持了数据内的层次关系,并证明了双曲节点向量表征的有效性和鲁棒性。
其他文献
光学与其他学科有着紧密的联系,研究发光不仅使光学获得长足的发展也为其他学科的发展助力。近年来,稀土发光研究有了新的突破,也带动了发光与农业、牧业、医学、军事等交叉学科的发展。由于稀土在发光中占据了很重要的位置,因此我们实验和理论相结合,研究了稀土掺杂硅/铝基氧化物荧光粉的发光强度、发光波长位置和长余辉性能,为其应用提供理论和实验基础。本论文具体分为八章:第一章是绪论部分,主要对稀土发光研究历史做了
学位
板块构造学说的建立是地球科学领域在二十世纪最为重要的进展之一。其中俯冲板片的形态和演化是板块构造学说的重要组成部分。俯冲板片自洋中脊处形成,在向两侧扩张的过程中逐渐冷却,并在海沟处下沉进入地幔。俯冲板片的温度结构在俯冲过程中对俯冲带地震的发生以及地表岛弧火山活动的形成与演化有着极为重要的控制作用,因此对俯冲板片热结构的研究是地球科学领域的重要问题。前人的研究已经建立了俯冲板片热结构的基本控制框架并
学位
全球变暖已经是不争事实,其带来的变化已经对人类的生存环境造成了严重的影响。已有研究指出,北半球区域内最大增暖速率出现在中纬度地区,尤其在30°N附近,平流层变冷、对流层变暖增强,对流层中低层大气水汽含量增加,相对湿度下降。东亚30°N纬度带(25°N~35°N,90°E~132.5°E)是典型的热带-温带气候的过渡带,地形地貌复杂多变,海拔高度差异显著,既有全球海拔最高的青藏高原,又有长江中下游丘
学位
热层和外逸层区域是大气-空间相互作用研究中的重点区域,其中共振荧光激光雷达是探测热层和外逸层大气动力学参数的重要手段。在热层和外逸层中性大气中存在着大量的氦原子、电离态氦和亚稳态氦,因此可以将热层中亚稳态氦原子作为示踪物,发展氦共振荧光激光雷达来实现200~1000km高度范围内氦密度的测量。本文介绍了氦共振荧光激光雷达的基本原理,提出了基于连续激光束的收发分置氦激光雷达系统,并对系统的探测性能进
学位
自从Geim等人对石墨进行机械剥离成功制备出石墨烯后,关于二维层状材料的研究迅速发展起来。通过对这些二维层状材料的实验和理论研究,人们发现维度降低会导致很多新奇的物理现象,如单层过渡金属硫化物中的高温铁磁性、电荷密度波、超导电性和可能的自旋液体等,新型二维层状化合物迅速成为凝聚态物理领域基础物理研究以及先进器件制造领域的热门材料。在对这些新型二维层状材料的研究中,人们发现这些关联电子材料中展现众多
学位
俯冲带镁铁质岩浆岩通常记录了俯冲地壳物质再循环,是研究俯冲带不同类型壳幔相互作用、大洋/大陆俯冲带构造演化和造山带岩石圈地幔性质的重要载体。华北陆块东部自古生代以来受到了北部古亚洲洋板片俯冲、南部古特提斯洋板片俯冲和华南陆块俯冲以及东部古太平洋板片俯冲的叠加影响,是研究不同类型壳幔相互作用的理想区域。该地区出露有中生代和新生代时期不同性质的镁铁质岩浆岩,为识别不同性质俯冲地壳物质再循环以及恢复造山
学位
想要机器人能够帮助人类从更多繁重、危险的劳动中解放出来,就需要机器人具有在非结构化环境中执行操纵任务的能力,而这是领域的一个挑战。软体机器人手臂因其具有被动柔顺性、连续变形性、交互友好性等性质为解决非结构化环境中的操纵问题带来了新的可能性。然而,由于受到软体手臂设计和控制两方面的限制,目前还没有工作探究软体手臂在执行操纵任务上的可能性。为此,本文首先探究了软体手臂的设计问题,基于蜂巢气动网络结构设
学位
近年来,随着石油化工、化学制药、机械制造、食品加工和纺织工业等行业的发展,越来越多的含油废水被排放到自然界中,引起环境污染和生态系统破坏等严重问题。在含油废水中,油的存在形式通常可以分为四种:浮油、分散油、乳化油和溶解油,其中乳化油的去除是含油废水处理的重点与难点。随着膜分离技术的迅速发展,不同种类的微孔膜材料被广泛应用到工业废水的处理中,但仍存在易被污染、水通量低、成本高等缺点,限制了膜分离技术
学位
目的 探讨血清内同型半胱氨酸(homocysteine,Hcy)、D-二聚体(D-dimer,D-D)水平对高血压相关脑梗死早期诊断的应用价值。方法 选取2019年1月-2021年12月本院接诊的56例急性脑梗死(acute cerebral infarction,ACI)患者进入ACI组;另同期选取56例健康体检者进入对照组。对患者的Hcy、D-D等指标进行检验,分析两组Hcy、D-D水平差异、
期刊
消费电子产品走向微型化、轻薄化、智能化,带动有效散热需求不断释放。工业界成熟的电子设备散热方案(传统的热设计)已经无法满足当今时代终端产品的散热需求。当下广泛应用于电子封装领域的低成本、轻质高分子材料几乎不具备散热功能。散热材料的开发已然成为制约电子芯片提高运算速率、功能性与可靠性,延长服务寿命的技术瓶颈。因此,开发新型散热高分子复合材料作为即经济又可靠的被动冷却方案,是解决高热导率材料的巨大需求
学位