图神经网络邻域关系研究

来源 :广西师范大学 | 被引量 : 0次 | 上传用户:xfjs08jx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
拓扑图作为数据表示的典型代表,既能反映实体特征又能体现实体间的关联关系,常用于表达化学分子结构、社交网络等复杂数据,具有强大的数据描述能力。图神经网络(Graph Neural Networks,GNNs)是基于拓扑图的深度学习模型,因其能聚合节点信息并捕获实体的抽象表示,从而在蛋白质分类、知识图谱和社交网络等任务中大放异彩。诸多数据挖掘研究证明,学习样本的邻域关系以揭示实体间潜在的相互作用规则是至关重要的。然而,对于音频、文本等欧几里德数据,其本身不存在拓扑关系,需要定义合适的方法来挖掘实体间的相互作用规则。如何为欧几里德数据构建拓扑图使其适用于GNNs仍有待研究。现存方法大多直接使用欧氏距离衡量节点的特征相似度,并以相似度定义邻域关系,易受离群点的影响。本文将提出更优的可执行方案。此外,社交网络等非欧几里德数据,虽具备天然拓扑图,但其往往存在噪音,主要表现为实体的邻域关系混乱,这使得GNNs性能骤降。究其原因,GNNs在执行节点分类任务时仅考虑节点特征相似度,忽略了原始拓扑图的局部结构特征,并且未对拓扑图进行动态优化。随着网络层数的加深,上述问题将伴随GNNs的过平滑现象,使得噪音难以清除。本文将提出相应方法解决拓扑图的动态优化问题,并缓解GNNs的过平滑问题。综上所述,本文提出两种挖掘邻域关系的方法,并与图卷积神经网络(Graph convolution neural networks,GCNs)融合,完成样本的半监督分类任务:(1)基于节点特征相似度的邻域选择方法。本方法构造关于邻域选择的凸目标函数,在优化损失值的过程中为GCNs生成拓扑图,主要适用于欧几里德数据。该方法引入空间转换矩阵,在低维映射空间进行邻域关系挖掘,并在挖掘过程中优化低维空间,使得欧氏距离更适合衡量样本间的相似度。该方法以迭代的方式优化损失值,不依赖梯度下降算法,故而亦适用于非深度学习算法。在12个欧几里德数据集上的实验证明,该方法所构造的邻域关系优于相关方法,分类性能得到明显提升,尤其在Cloud、Wdbc、Iris和Thyroid数据集上的分类准确率均超过90%。该方法为如何构建拓扑图提供了可行方案。(2)基于注意力机制的邻域关系构建方法。本方法在聚合邻域节点信息时,充分利用原始拓扑图所蕴含的信息,兼顾节点间的邻域结构相似度和节点特征相似度。在此方法中,邻居节点数量和关联强度由算法自适应,真正实现端到端的邻域关系构建。经可视化证明,同类节点的高阶特征能够有效聚合,不同类节点能够有效分离。十折交叉实验证明,所提方法在基线数据集Cora、Citeseer和Pubmed上的分类准确率均高于GCNs和图注意力网络(Graph Attention Networks,GAT),证明了邻域结构相似度有助于优化拓扑图,从而缓解过平滑问题,提升分类性能。
其他文献
目的:通过观察“消疤草”对大鼠肝纤维化组织CD147表达的影响,探索“消疤草”预防大鼠肝纤维化的作用机理,为苗药“消疤草”的开发利用提供理论依据。方法:72只Wistar大鼠随机地分为正常对照组、模型组、扶正化瘀组、“消疤草”高(原液)、中(1/5原液)、低(1/10原液)剂量组共6组,每组12只。除正常对照组外,其余各组别均予40%CCl4葵花籽油液经皮下注入、腹腔注射猪血清、30%酒精灌胃(每
学位
大数据时代的来临,使得基于神经网络的深度学习算法广泛地应用于生物医疗、面部识别等现实生活场景中。然而,具有不同背景知识的攻击者通过直接获取原始数据敏感信息或间接提取模型参数的方式来获取利益,甚至通过生成对抗样本的方式导致模型分类错误。深度学习所面临的隐私泄露及安全风险直接阻碍了深度学习的发展。因此,深度学习的隐私保护已逐渐成为近年的研究热点。差分隐私作为一种提供严格数学证明的隐私定义,旨在保护敏感
学位
随着三维点云技术的发展和普及,三维点云图像处理技术在诸多领域中有着广泛的应用。三维点云图像处理技术成为三维扫描测量系统、三维重建、逆向工程、计算机视觉以及机器人导航等领域中的核心部分。由于三维扫描设备无法一次性获得待扫描对象的全部点云图像,因此,通常会将三维扫描设备围绕目标对象移动来进行多次扫描,再将从不同方向获得的点云配准到公共的坐标系,以获取完整的三维模型。这一过程叫做三维点云配准。三维点云配
学位
学位
<正> 有关内蒙古地区的鱼类调查过去做得很少,先后只有日人大岛正满(M.Oshima,1926)木村重(S.Kimura,1934)和森为三(T.Mori,1941)等于赤峰、热河、包头三地作过零星报道,但对呼和浩特鱼类的系统研究则尚未进行。内蒙古大学生物系于一九六二年夏季,趁暑假实习前后之便,曾作大量采集而获鱼类标本一千余尾。
期刊
目的:探讨血清维生素D水平、天冬氨酸氨基转移酶/血小板比值指数(APRI)和基于4因子的肝纤维化指数(FIB-4)对慢性乙型肝炎肝纤维化的临床诊断价值。方法:采用回顾性研究方法,选取2020年1月至2021年12月在贵州医科大学附属医院感染科就诊的行肝穿刺活检的慢性乙型病毒性肝炎患者为研究对象,共245例,根据肝穿刺病理活检结果将肝纤维化分期(S)分为无纤维化组(S0)60例,轻度纤维化组(S1)
学位
目的探究红细胞分布宽度(RDW)、中性粒细胞与淋巴细胞比值(NLR)与传统肿瘤标志物癌胚抗原(CEA)、糖类抗原19-9(CA19-9)联合检测对胃癌诊断和分期的价值。方法回顾性纳入2014年11月至2021年11月就诊于贵州医科大学附属医院的胃癌患者、癌前状态及癌前病变患者、慢性非萎缩性胃炎患者。胃癌患者根据国际抗癌联盟(UICC)2016年第八版TNM分期系统进行分期,并根据TNM分期结果进一
学位
剪纸艺术是我国最古老的民间艺术之一,寄托了当地人民对美好生活的期盼和向往。通过一幅幅精美的作品,能够反映出该地区的社会风尚、人文风情和生活习惯。徐州剪纸由于其独特的地理位置以及楚汉文化的影响,成为了该地区特有的民间艺术形式。将徐州剪纸运用到室内设计中,对徐州剪纸艺术的传承发展和室内空间文化内涵的营造具有积极的作用。本文对徐州剪纸艺术特征、徐州剪纸在室内设计中的应用方法和应用形式进行了简要分析,希望
期刊
目的:通过Meta分析及临床病例观察研究,初步探讨DAA治疗的HCV/HBV重叠感染患者出现HBV再激活的风险性、HBV再激活对DAA抗HCV的疗效的影响,为HCV/HBV重叠感染患者临床合理用药及预防抗HCV治疗后HBV再激活提供理论依据。方法:1.采用meta分析研究HCV/HBV重叠感染患者DAA治疗后HBV再激活的风险性,计算机检索外文数据库Pub Med、Web of Science、E
学位
无线网络中的移动用户在日常活动中具有较强的时间规律,造成了网络流量的高时变性特点。编码缓存由Maddah-Ali和Niesen最先提出,是一种将网络流量高峰时期的压力转移到低峰时期的网络编码技术,缓解了网络流量高峰时期的压力。基于中心化网络模型,Maddah-Ali和Niesen提出的中心化编码缓存方案(MN方案)在未编码缓存和用户请求不同文件时的通信负载达到了顺序最优。PDA(Placement
学位