对抗样本生成在网络空间安全中的研究与应用

来源 :贵州大学 | 被引量 : 0次 | 上传用户:biantaitai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,机器学习在网络空间安全领域得到了广泛的应用,尤其是在入侵检测和恶意代码检测场景中。研究人员往往更关注网络空间安全领域基于机器学习的安全检测系统的检测性能,而忽略了由于机器学习算法自身的脆弱性所带来的安全隐患。对抗样本的出现吸引了越来越多的研究人员关注机器学习算法自身的安全性。通过向原始输入中加入精心设计的扰动而生成的对抗样本,能使目标分类器产生错误甚至是对手指定的输出结果。网络空间安全作为一个安全关键性的领域,对抗样本的存在严重阻碍了机器学习在该领域的深入应用。当前对抗样本生成研究主要集中于计算机视觉领域,网络空间安全领域的对抗样本生成研究还处于起步阶段。并且,当前对于对抗样本的成因还没有明确的数学解释,所以还无法构建有效的对抗样本防御方法。通过开展网络空间安全中对抗样本的生成研究,一方面可以为解释对抗样本的形成原因提供理论支撑,并为后续构建有效的对抗样本防御技术提供灵感和思路;另一方面还能通过“以攻代防”的方式保障网络空间安全领域基于机器学习的安全检测系统的安全。因此,开展网络空间安全领域对抗样本的生成研究既具有理论价值又具有实践意义。本文在现有的对抗样本生成研究基础上,结合网络空间安全领域各个场景的特点,梳理并总结了在网络空间安全领域生成对抗样本时需要解决的关键问题,并给出了相应的解决方案。本论文的主要研究内容和贡献如下:(1)本论文首先系统地梳理了网络空间安全各个应用场景中输入数据的类型,在此基础上提炼出了在网络空间安全中生成对抗样本时需要解决的主要问题:1)网络空间安全中基于机器学习的安全检测系统的输入可能是离散值,可能是连续值,也可能是离散值和连续值的组合。因此,在生成对抗样本的过程中,需采取措施保持离散值特征的离散性;2)网络空间安全领域生成的对抗扰动不能破坏输入的原始功能,从而保证所生成对抗样本的有效性,所以在网络空间安全领域,通常只能扰动原始输入的非功能性特征。针对这两点,本论文在设计用于网络空间安全各个应用场景的对抗样本生成方法时,都根据相应场景的特点给出了相应的解决方法。(2)针对主流的基于生成对抗网络的黑盒攻击方法存在的不足,本文提出了一种新的更适合于基于机器学习的安卓恶意代码检测系统对抗鲁棒性评估的黑盒对抗样本生成方法,该方法通过在受限的特征空间中穷举搜索能使目标系统产生错误分类的对抗特征来生成对抗样本,因此被称为暴力枚举攻击方法。相较于基于生成对抗网络的黑盒攻击方法,暴力枚举攻击方法原理更简单,更易于实现,且避免了基于生成对抗网络方法的繁琐的训练过程,能更高效地生成对抗样本。暴力枚举攻击方法以确定的方式生成对抗样本,因此攻击性能更稳定。本文在主流的DREBIN安卓恶意代码数据集上验证了所提出方法的有效性,实验结果表明暴力枚举攻击方法在主流的机器学习分类器上的攻击性能要优于基于生成对抗网络的攻击方法。(3)主流白盒对抗攻击方法在网络入侵检测场景中的攻击性能通常不太理想,本论文提出了三种新的对抗攻击强化方法,用于强化主流白盒攻击方法在网络入侵检测场景中的攻击性能。所提出的强化方法采用统一的底层架构,屏蔽了被强化算法的底层细节,通过统一的接口来高效地提升不同类型的白盒攻击方法的攻击性能。本论文在NSL-KDD入侵检测数据集上验证了所提出的方法的有效性,实验结果表明本文提出的三种对抗攻击强化方法能有效提高常见的基于梯度的白盒对抗攻击方法在网络入侵检测场景下的攻击性能。本文还评估了三种强化方法生成的强化对抗样本在不同类型的机器学习分类器之间的可传递性。(4)基于机器学习的主机入侵检测系统的输入通常为离散值向量。主流的白盒对抗攻击方法通常只支持生成微小的连续值扰动。为了能更好地评估基于机器学习的主机入侵检测系统对对抗样本的鲁棒性,本论文提出了一种新的用于生成离散值对抗扰动的白盒对抗样本生成方法,该方法通过在计算扰动的过程中对其进行离散化来保持生成的对抗样本的离散性。由于该方法每次对原始输入添加对抗扰动后,被扰动的特征都会从一个状态直接进入另一个状态,因此该方法被称为迭代阶跃方法。本文在ADFA-LD主机入侵检测数据集上,比较了迭代阶跃方法与主流的白盒对抗攻击方法在常见机器学习分类器上的攻击性能,实验结果表明迭代阶跃方法在常见机器学习分类器上的攻击性能要优于主流的白盒对抗攻击方法。此外,本文还比较了迭代阶跃方法生成的对抗样本和主流的白盒攻击方法生成的对抗样本在不同类型分类器之间的可传递性。
其他文献
二氮稠环类衍生物具有杀菌、杀虫、抗肿瘤、抗疟多种生物活性。其母核骨架如喹唑啉环、喹唑啉酮环、氮杂吲哚环等互为生物电子等排体,在进行先导化合物优化时可以相互替换,从而达到改善原药代谢动力学性质地目的。因此,二氮稠环类化合物是一类重要的杂环分子,在化学生物学研究领域具有重要的地位。该类化合物中,喹唑啉酮和7-氮杂吲哚由于对肺炎链球菌、耐药金黄色葡萄球菌等动物病原菌有很好的抑制活性,近期受到人们广泛关注
海冰运动是指在浮冰尺度或更大空间尺度下的海冰受大气、洋流等外力驱使而产生的漂移和相互作用,由海冰运动引起的海冰输运和海冰形变是造成海冰厚度、海冰面积等发生空间重分布的主要动力学原因。依靠浮标等现场观测手段获取海冰运动信息具有较大的时空局限性,全方位、全时相观测海冰运动得益于卫星遥感技术的发展。基于卫星遥感数据反演的海冰运动产品已广泛应用于海冰变化研究与海洋(气候)模式参数化等领域,但由于数据源和反
学位
分类是大数据分析的核心任务之一,在顾客行为挖掘、医疗诊断、灾害预警等国计民生方面有许多典型应用,是目前的前沿热点研究方向之一。然而,在真实环境中采集到的数据如果未经过人工调节平衡,各类数据会在数量上呈现不平衡分布的形态,对分类模型有负面的影响,如银行坏账、癌症数据、灾害数据等在所收集的相关数据中占比很小。现有的特征选择和采样算法大多以最大化分类准确率为准则,有利于对大类别数据的分类,却制约了小类样
学位
肾透明细胞癌(clear cell Renal Cell Carcinoma,ccRCC)是肾脏发病率最高的恶性肿瘤,约占肾细胞癌(Renal Cell Carcinoma,RCC)的70%~80%,其早期临床症状不典型,确诊时通常已进展到中晚期。ccRCC的主要治疗方法是根治性切除术,但术后约有三分之一病例会出现肿瘤复发或进展。研究表明,肿瘤坏死和分级、分期作为ccRCC重要的预后指标,可反映c
学位
全球气候变暖是世界各国热切关注的话题,植被作为陆地生态系统的重要组成部分对气候变暖响应敏感。山地是气候变化的敏感区,其变暖趋势及植被响应均受到地形的控制且错综复杂。研究气候变化背景下的山地植被空间分布格局及其变化的地形分异效应,对于山地生态系统科学应对气候变化意义重大。秦岭山地层峦叠嶂,巨大的海拔落差及北陡南缓、北阴南阳的地形特征使其成为研究气候变化及植被响应的天然实验场。本文以位于陕西境内的秦岭
肿瘤恶病质是由肿瘤细胞产物及机体释放的细胞因子(炎症因子、外泌体等)共同引起的一种进行性消耗综合征,最主要的特征是骨骼肌萎缩与脂肪降解所带来的病人体重下降。肿瘤恶病质是导致众多肿瘤患者死亡的主要原因,其发病机制尚有诸多不明之处,临床治疗成效有限,目前尚没有任何一个药物被批准作为特异性针对肿瘤恶病质的药物上市运用,所以寻找新的治疗药物以及深入探索肿瘤恶病质的发生机制刻不容缓。本论文利用TNFα与C2
自20世纪下半叶互联网概念提出至今的几十年内,通讯系统中的信息传输与处理量已呈几何式激增,光纤为主体的信息通讯网络面临着严峻挑战。对于信息的编码处理,电信号则需经光调制器实现光波上的加载,面对通讯网络内激增信息传输与处理量,对光调制器自身信息处理速度等核心性能有更高要求,需要在信号调制速率、器件集成度、多工作带宽和单字节能耗等性能方面得以拓宽与提升。传统电光调制器件则由于所使用器件材料以及工艺极限