代码漏洞检测模型的对抗攻击方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:lingxiaodong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
漏洞检测一直是软件安全领域的一个重要研究问题,近年来,基于深度学习的代码漏洞检测技术取得了长足的进展,相比于传统方法,它不依赖领域专家,能够自动提取漏洞模式。然而,已有研究表明,深度学习模型具有脆弱性,在样本上施加一个精心设计的小扰动,就有可能成功欺骗模型,使模型输出错误结果,如果稍加扰动就可以让漏洞程序逃避检测,这将对软件安全造成巨大的威胁,施加扰动的方法即是对抗攻击方法。目前,针对对抗攻击方法的研究集中在图像和自然语言处理领域,对源代码任务领域的研究很少。图像和自然语言处理领域的对抗攻击方法无法保证程序语法和语义的正确性,不能直接应用在源代码任务上。在源代码任务领域中,最常见的攻击方法为标识符重命名,通过重命名函数、变量等标识符来生成对抗样本。然而,标识符重命名仅适用于依赖标识符的深度学习模型,普适性不强,例如本文选取的模型会标准化标识符,重命名标识符不会改变标准化后的程序。为了解决这一问题,本文提出采用变异测试生成变异体和代码混淆作为攻击方法,并通过组合这些攻击方法扩大对抗样本搜索空间,提高攻击成功率。通常组合攻击方法需要在非常大的样本空间中搜索对抗样本,本文提出利用贪心算法和遗传算法提高搜索效率。经实验验证,本文攻击方法能够成功欺骗受害者模型,在测试集中随机采样的样本集合(攻击样本集合)上,攻击成功率达到78.41%。此外,利用对抗训练方法重新训练漏洞检测模型,新模型在受害者模型测试集上的F1值达到0.8765,相比受害者模型提高了0.0055,在原有攻击样本集合上攻击成功率为72.81%,相比受害者模型下降了5.6%。本文攻击方法结合对抗训练可以提高模型性能和鲁棒性。
其他文献
乳腺癌在全球已经成为一种非常严重的影响女性健康的疾病。研究发现,尽早发现和尽早治疗能够极大的挽救乳腺癌病人的生命。由于地区医疗水平不同和医生经验多少的影响,乳腺癌的诊断仍面临着许多问题。利用乳腺超声影像可以辅助医生进行乳腺癌的诊断,为了排除医生的经验和能力对最终诊断结果的影响,人工智能可以对超声影像进行辅助分析。其中,乳腺超声图像的分割的准确性对于人工智能的辅助能力有较大影响。大部分研究者都只是集
学位
细胞自噬是一种溶酶体依赖的细胞组分程序性降解通路,在进化中高度保守。细胞自噬通过将受损细胞器和错误折叠蛋白质等物质降解,一方面可以消除这些受损细胞器或蛋白质对细胞的不利影响,另一方面通过对这些物质的重新利用满足细胞的物质能量代谢需求。哺乳动物成体心肌细胞通常被认为是一类终末分化的细胞,几乎没有自我更新能力,通过细胞自噬实现细胞蛋白质和细胞器的自我更新对于维持心肌细胞的存活和稳态更为重要。在过去的十
学位
随着语音技术的飞速发展,深度语音伪造变得越来越方便,这项技术也从高门槛逐渐走向大众,让充满创意的深度伪造语音变成大众娱乐。但在深度伪造语音方便大众的同时也混淆着大众视听,基于深度学习的语音伪造技术让听起来真实的消息不再真实,使得重要的视听消息变得难以让人相信,影响了大众生活,甚至造成财产损失和威胁生命安全,因此,深度伪造语音的检测变得尤为重要。首先,提出加强小波包能量谱,并融合语音特征提取的多种方
学位
位移是结构健康监测的重要指标,广泛用于评估结构的健康状况。考虑到传统位移传感器的局限性,近些年来,研究者们提出了大量基于视觉的方法来进行结构位移监测。与传统位移传感器相比,基于视觉的方法具有远距离、非接触、易部署、成本低等诸多优点。目前基于视觉的结构位移监测方法主要分为三个步骤:首先,通过相机标定方法获得二维图像与三维世界的映射关系,然后通过视频目标跟踪技术获取到目标建筑在视频中的像素位移,最后将
学位
近年来,电子商务如雨后春笋般不断发展壮大,其涵盖面越发广泛,并迅速引领社会发展潮流,电子商务行业已成为国民经济发展的一支坚实力量。自2020年1月月末,新型冠状病毒肺炎疫情进入了大规模爆发期,在这一艰难时段,电子商务的线上运营优势也逐渐显现出来,电商行业所受到的复工影响程度相比其他行业较低,其更高的复工率令其他行业望尘莫及。电商网络具有网络异构性,异构网络表征学习及用户社区划分是挖掘电商网络异构信
学位
生物通路对于研究疾病致病性有重要意义,它对于识别药物靶点和改善疾病临床的治疗效果有着指导意义。高通量测序技术的不断完善,使得生物通路数据被大量积累,因此如何从繁杂冗余的数据中有效提取生物通路信息是当下迫切需要解决的难题。当前存在不少生物通路知识库提供给研究人员通路可视化和生物通路检索功能,还有个别的生物通路知识库能够根据各种用户需求提供差异化的通路排序结果,且检索结果能够按照用户习惯动态更新,但是
学位
近年来,随着计算机技术的不断发展,人工智能领域的研究突飞猛进。其中图卷积神经网络已经成为学习复杂结构与性质之间的关系等应用的一个非常有效的框架。图卷积神经网络在图结构数据上表现出来了非常优异的性能,因此越来越多的研究者开始聚焦于该方向。在诸多方向中由于使用图卷积神经网络进行分子属性预测在分子生成和药物发现等领域起到极为关键的作用,分子属性预测成为了越来越热的研究方向。在化学领域,计算分子的属性通常
学位
计算机视觉技术领域的研究进入了深度学习时代后,人脸检测作为计算机视觉领域中一直都在研究的问题,也跟随人工智能技术不断向前发展,深度学习时代的人脸检测算法也可以从跟通用目标检测的关系来从两个不同的角度看待,分别是专为检测人脸目标而设计的检测器,此类算法大多从人脸与其他目标相比而独有的特征出发而设计,另一种就是在通用目标检测算法的基础上,做一定针对于人脸目标的调整,此类算法的设计往往更加简洁,且具备更
学位
学位
在当今的数字化时代,我们对图像质量提出更高的要求,各个领域的发展都离不开图像。但是由于采集设备的传感器缺陷,或通过通信信道传输的过程中图像容易被脉冲噪声所破坏,具体表现为图像中随机出现的黑点和白点,故也可叫做椒盐噪声,椒盐噪声不仅影响我们视觉对图像质量的判断,而且还会对后续其它图像处理任务造成影响。去除椒盐噪声的方法有很多,有学者提出基于模糊理论的两阶段噪声检测与去除方法,优点是结合模糊理论处理不
学位