面向节点分类任务的图拓扑攻击方法研究

来源 :河南师范大学 | 被引量 : 0次 | 上传用户:genggeng07
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实中的许多场景都可抽象为图或网络,即节点和边的集合,例如社交网络、引文网络、交通网络等。节点分类是图上最常见的任务之一。近年来,随着神经网络和深度学习技术的快速发展,图神经网络模型被广泛关注并在节点分类任务中有出色表现。但研究发现神经网络容易受到对抗攻击,即向神经网络中注入少量精心设计的扰动样本便可使其产生错误的输出结果。当前的对抗攻击方法大多是针对图像、语音、文本等连续数据提出的,仅有少量的对抗攻击模型是基于离散的图数据。考虑到基于图数据的神经网络模型在恶意软件检测、诈骗用户检测等安全领域的广泛应用,图对抗攻击的研究还具有较大空间。本文选择在节点分类任务中有出色表现的网络嵌入模型Deepwalk和图卷积网络模型GCN(Graph convolution network)展开对抗攻击的研究:首先针对基于简单神经网络的Deepwalk模型提出拓扑攻击方法,Deepwalk利用随机游走和Word2vec中skip-gram模型来学习节点的低维向量表示。随机游走过程的随机性和图数据的离散性使得难以利用基于梯度的方法来生成对抗样本。为了克服这一困难,研究发现基于随机游走的网络嵌入模型可近似等价于矩阵分解。因此提出利用其等价的矩阵分解形式作为替代模型进行拓扑攻击,并结合矩阵特征值扰动理论寻找最优的对抗样本,将扰动后的图应用于Deepwalk模型中重新训练。结果表明少量的扰动样本就可降低Deepwalk的分类效果。然后针对图卷积网络模型GCN提出拓扑攻击方法,图卷积网络模型参数复杂,训练时间长,这些问题给对抗样本的生成带来了挑战。因此提出利用简化的图卷积网络模型SGC(Simplified Graph Convolution Network)作为替代模型进行拓扑攻击。SGC利用线性方程替代GCN中的非线性激活方程,使得对抗样本的生成可并行计算。在攻击方式上选择网络重连的操作,即针对特定目标节点删除一条边的同时再插入一条边,使得目标节点的度值不发生变化,且整个网络的边数也不发生改变。在替代模型SGC上找出最优的扰动样本,将扰动后的图作为GCN的输入重新进行训练,进而评价攻击算法对节点分类任务的影响。实验结果表明少量的对抗样本就可使得GCN对目标节点产生错误的预测类别。本文分别针对网络嵌入模型Deepwalk和图卷积网络模型GCN进行拓扑攻击研究,并在节点分类任务上进行实验。实验结果表明少量的对抗样本就可使模型的分类效果下降,且对抗样本具有一定的迁移性。
其他文献
大同市南郊轴承厂遗址出土的石雕方砚,纹饰繁复,制作精巧,是北魏平城时期物质文化的代表作。本文通过考察石雕方砚的器形和纹饰,推断其制作年代为北魏太和年间,其装饰纹样综合了汉地、域外和佛教元素,体现了文化融合的特征。不同于魏晋南北朝时期墓葬出土的四足方砚,此件石雕方砚并非明器,其出土地大同轴承厂遗址是北魏平城时期一处有一定规模且等级较高的建筑,且不排除舍宅为佛寺的可能。基于相关图像资料,作者对砚台与书
期刊
湖北丹江口庞湾窑址,是明代专供武当山琉璃烧制的皇家官窑,时代为明代早中期到清代早期。本文重点对出土于庞湾窑址的琉璃原料、半成品、成品进行化学分析——结果表明:庞湾琉璃普遍采用一类低铝低硅、高铁高钙高镁的黏土制胎,在庞湾村中河南岸发现有类似组成的原料,表明琉璃的胎料很可能取自本地。琉璃的铅釉化学组成比较稳定,成分接近于PbO-SiO2-CaO-Al2O3低共熔混合物。配制铅釉时应该直接加入了石英类的
期刊
近年来,随着数据挖掘的不断发展,聚类算法在图像分析、模式识别、信息检索等领域具有广泛的应用。k-means聚类作为聚类分析中经典算法之一,在聚类时需要数据的支持,然而,由于数据可能包含用户的敏感信息,使得k-means聚类给我们生活带来便利的同时,数据的安全性也受到威胁。隐私保护k-means聚类是指在保护数据隐私的情况下,将数据安全地分成k类。现有的隐私保护k-means聚类方案存在计算效率低、
学位
超像素算法是计算机视觉领域中重要的预处理工具,近年来被广泛应用于计算机视觉的各个领域,特别是在植物叶片分割和农田遥感图像分析中。在图像处理任务中使用超像素算法的优点包括:可以减少噪声和冗余信息对后续使用的影响,保留图像的结构特征,减少图像元素的数量,使对图像进行大规模计算成为可能。在实际的应用中,经典的超像素算法在超像素数量较少的情况下并不能表现出良好的边界准确度,这给进一步使用超像素进行图像分析
学位
我国中小企业数量庞大,涉及的科技行业方方面面,是国家经济行业发展的基石。但是目前在中小企业中普遍存在一些问题,例如高质量的科技型人才稀缺,创新能力不够等。在高校中,许多科研团队的优秀研究成果投入实际应用的案例并不多,没有对社会进步产生可观的推动作用。中小企业与高校科研团队之间信息严重不对称,创新链与产业链的对接进展情况并不理想。针对上述现象,本文构建企业科技需求的行业分类模型和科研团队的推荐模型,
学位
严文儒、尹军主编《董其昌全集》的整理出版,嘉惠学林。然是书搜罗、补辑亦有不尽详备之处,董氏的诗文作品或有遗漏。由明万历间王氏三槐堂刻本《王文恪公集》及清代《京江张氏家集》之中,便可摭拾两篇董其昌佚文,为《震泽先生集序》和《明布政使司经历绍南张公传》。二文皆作于明神宗万历年间,对这两则佚文进行辑考,既可弥补《董其昌全集》的缺漏和遗憾,更为考索董其昌与洞庭东山王氏、丹徒京口张氏的交往增补了新证据。
期刊
谢瑞阶被称为“黄河老人”,他为我国黄河题材山水画的发展做出了卓越贡献;也是一位杰出的教育家,培养出了众多美术工作者;所创作出的具有民族特色的黄河题材山水画作品影响了中国黄河题材山水画坛。经历了晚清、民国、新中国三个历史时期,近百年的沧桑巨变,使得他的艺术创作有着独特的个人风格。现当代中国黄河题材山水画的繁荣发展,谢瑞阶在其过程中起到了关键作用,他创立的独特黄河题材山水画,在中国近现代山水画历史上也
学位
蛋白质作为人体生命活动的主要承担者,在生命科学研究中扮演着重要角色。对嗜热蛋白的研究能使我们对疾病的机理更加了解,为嗜热蛋白的功能研究及其相关的药物设计和催化剂研制提供了重要线索。常规的生物实验方法虽然可以准确分辨蛋白质的类别,但成本较高耗时较长无法满足大规模的蛋白质识别实验。因此,开发可靠的计算方法,快速精确地预测蛋白质的类别尤其重要。鉴于大部分的蛋白质预测模型中仅仅提取单一特征而造成预测性能不
学位
教育信息化的不断深入给教育领域带来新的挑战,提高学生的核心素养成为信息化时代教育领域关注的核心问题。而信息技术课程能有效体现学生核心素养的发展。本研究调查发现,实际的教学活动中信息技术学科地位较低,且存在教学形式传统、教学方法单一等问题,阻碍了核心素养的提高。深度学习指向学生知识理解、自主学习、探究协作、沟通交流、批判理解等能力的培养,这与核心素养的内涵一脉相承,且翻转课堂教学模式在某种程度上是深
学位
随着数据挖掘技术的不断发展,越来越多的教育工作者开始通过分析教育环境中产生的独特类型的数据来解决教育问题,教育数据挖掘已成为热点研究问题。学业成绩作为最能直观反映学生学习效果的评价指标,得到众多研究者的广泛关注,如何有效利用相关数据并从中挖掘有价值的信息,用于改善教学与促进学生发展,成为一个重要问题。课余生活是学生学习之外的重要组成部分,随着人工智能时代的来临,初中生的课余生活越来越丰富,课余生活
学位