基于强化学习的恶意流量检测与对抗样本生成研究

来源 :四川大学 | 被引量 : 0次 | 上传用户:colleagelxs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息化技术和互联网的快速发展正深刻地影响着人民的生产与生活方式,我国社会正逐步朝着信息化社会迈进。根据第47次《中国互联网络发展状况统计报告》[1],截止2020年底我国的互联网普及率已达70.4%,人民的生产和生活与网络紧密相关。然而,在人们享受信息化与智能化所带来的便利同时,网络空间中所存在的安全问题是无法被忽视的。《2019年我国互联网网络安全态势综述》[2]中的统计数据显示,约有44.4%的网民2019年在上网过程中遭遇过网络安全问题,网络安全问题愈发严峻。网络空间安全的稳定意义重大,而保障网络空间的安全离不开对于网络空间中“攻”与“防”的研究。恶意流量作为网络空间中的一大攻击载体,从“攻”与“防”两方面对其开展研究对于保卫网络空间安全有较为深远的意义。从防御的层面来看,尽管基于监督学习方法的恶意流量检测技术已展现出其优越的能力。然而,在监督学习算法中使用的流量特征不易确定,并且穷尽流量特征与学习算法的组合是不切实际的。如何有效地自动选择特征子集,确定学习算法以构建高效的恶意流量检测器是需要研究的关键问题。同时,对攻击层面的深入研究也能够有效地促进防御技术的提升。因此,考虑到监督学习算法对于对抗样本敏感的缺点,从攻击的角度对恶意流量对抗样本生成方法进行研究也具有一定的必要性。如何生成恶意流量对抗样本用于检测器预训练以应对潜在的对抗攻击进而实现主动防御亦是非常值得研究的问题。综上所述,针对现有恶意流量检测技术的不足以及对抗场景下恶意流量检测器不够鲁棒的问题,本文提出了基于强化学习方法的恶意流量检测器构建方案以及恶意流量对抗样本生成方法。本文对于恶意流量检测与对抗样本生成两方面的研究不仅能提升恶意流量检测器在非对抗场景下的性能,还能提升其在对抗场景下的鲁棒性。本文的主要贡献如下:(1)针对基于机器学习方法的恶意流量检测器构建过程中流量特征选择与训练算法不易确定的问题,本文提出了一种基于强化学习DQN算法的恶意流量检测器生成方案DQ-MDCS。将恶意流量检测器的构建过程形式化为决策问题,对强化学习算法中状态空间、动作空间以及奖励函数进行了问题建模。通过对智能体的不断训练,使得其能够在无需人工干预的情况下选择低冗余的流量特征,并确定学习算法用于恶意流量检测器的训练生成。基于NSL-KDD的Test+数据集,通过DQ-MDCS构建的恶意流量检测器能够有效的识别恶意流量,其检测准确率可达88%。同时,所生成的恶意流量检测器能够快速识别恶意流量,检测器体积容量更是缩减至了56Kb。相比于基于深度学习方法的恶意流量检测器,DQ-MDCS所生成的检测器响应时间更快也更加轻量,可以适应现实世界的情况。(2)针对基于监督学习方法的恶意流量检测器对于对抗样本不够鲁棒的缺点,本文提出了一种基于强化学习A3C算法的恶意流量对抗样本生成方法A3C-MTAG。该方法旨在生成恶意流量对抗样本用于恶意流量检测器的训练,提升检测器在对抗场景下的稳定性,从而实现积极主动防御。通过模拟恶意流量与恶意流量检测器交互的过程,训练智能体对原始恶意流量样本采取动作,并向其中添加细微的扰动以生成恶意流量对抗样本。实验结果表明,相比于未经对抗样本训练的恶意流量检测器,重训练后的恶意流量检测器的检测准确率最多可提升近50%,进一步提升了防御性能。同时,基于相应的研究结果给出了对抗场景下基于监督学习方法的恶意流量检测器可行的防御措施。
其他文献
在低空监视领域中,小型飞行器的机载设备受制于功率和成本,很难准确播报本机的运动参数,只能通过雷达对其进行主动检测。这类小型飞行器具有的飞行高度低、飞行速度慢和雷达反射面积小等特点,极大增加了雷达目标检测的难度。日益增多的小型飞行器造成了许多空管事故,因此,提升雷达对低空空域小目标的检测能力,成为近年来空管领域需要迫切解决的问题。本文针对基于深度学习的雷达目标检测算法展开了深入研究,根据低空目标的特
数字图像一直在信息的传递过程中扮演着重要的角色。如今多媒体信息爆炸的时代充斥了图像和视频等数字信息,同时也存在着包含大量模糊人脸图像的问题。无论是人们日常分享生活、传递信息还是在科研领域中如智能安防、目标或人脸检测或者自动驾驶等计算机视觉任务都需要依托大量清晰的图像,因此将模糊图像重新变得清晰是一个急切且广泛的需求。在图像处理领域中,将图像的模糊主要分为了高斯、散焦、运动、衍射等类型,其中由运动所
光相干层析扫描技术(Optical Coherence Tomography,OCT)因具有非侵入性和微米级分辨率的优点而成为眼科疾病诊断的重要工具。然而,基于OCT技术的诊断存在两个无法避免的问题。首先,采集的OCT图像中存在大量斑点噪声;其次,在采集过程中,为了尽可能避免数据丢失,通常采用低空间采样率进行采样,但由此得到的OCT图像具有较低的分辨率。因此,当前临床上需要可行有效、并能同时实现O
增强现实技术将经过计算机渲染的虚拟物体与真实场景相融合,广泛应用于电影制作、医疗辅助、工业生产、娱乐等领域。为了保证虚拟物体和真实场景融合的真实感,需要渲染虚拟物体时使用的光照信息与真实环境保持一致,实现虚实融合的光照一致性。受可控光源的影响,室内场景中的光照条件比较复杂并且具有动态变化的特点。对室内场景光照的动态变化进行估计,是实现增强现实光照一致性的重要技术。综上,室内场景的动态光照估计具有重
计算机断层扫描(Computed Tomography,CT)能够利用人体组织对X射线吸收率差异进行成像,以无创的方式获得人体的内部结构图像,因此在临床医疗中被广泛应用于疾病的筛查和诊断。由于X射线辐射对人体具有潜在危害,低剂量CT(Low Dose CT,LDCT)逐渐成为了当前CT成像的主要研究方向。减少X光照射剂量和降低曝光时间是目前减少X射线累积辐射的主要手段,然而X射线的剂量减少会引起量
信号调制识别在电子战、通信侦察、雷达侦察、无线电频谱监测与管理和链路自适应等领域有着重要的应用。但如今信道环境越来越复杂且信号调制方式不断增多,如何高效且准确地完成复杂环境中信号调制识别是当前通信各个领域亟待解决的难题。本文以某电子对抗部队非协作通信为背景,针对信号调制识别中传统算法识别性能低、计算复杂度高等问题,基于深度学习对AWGN信道和Rayleigh衰落信道中信号调制识别关键技术进行研究。
行人实例分割是对图像进行实例级和像素级处理的技术,是计算机视觉领域中一项重要的研究任务。当前的行人实例分割存在分割精度不高、缺乏对分割后的行人实例效果检验等问题。本文针对此问题展开研究,主要工作和创新点如下。1.针对当前行人实例分割精度不高的问题,提出了一个行人实例分割与提取网络。网络基础部分,采用单阶段网络设计结构,使用特征金字塔网络提取特征;网络主干部分,分为行人检测分支和行人实例分割与提取分
肺癌是中国发病率和死亡率最高的癌症,恶性肺结节的早期筛查能够显著降低肺癌的死亡率。胸部计算机断层扫描(Computed Tomography,CT)图像能够以非侵入的方式捕获肺结节的异质性,是目前肺癌早筛的常规方法。精准的肺结节定性极其困难,其不仅是因为医生在高强度的工作负担下无法保持高度集中来做出准确的判断,而且还在于人眼难以捕捉到发生在CT值细微变化的肺结节异质性。肺癌的计算机辅助诊断(Com
电子计算机断层扫描(CT)技术可快速获取人体组织结构图像,得到的图像具有极高的空间分辨率以及清晰度。CT技术目前已经成为临床诊断的重要方式,为临床医生对疾病诊断和治疗提供了强有力的帮助。随着CT技术的广泛使用,检测时产生的辐射对受检者所造成的伤害不容忽视,过量CT辐射将严重损害受检者的身体健康。但是,降低CT检测的辐射剂量会导致CT图像出现噪声、伪影,引起图像质量下降。这些噪声、伪影经常掩盖细微但
近年来慢性非传染性疾病对人类健康的威胁日益增大。各类慢性病因其复杂的发病过程,很难确定疾病的发病时间。慢性病的早期筛查和确诊是公认的降低慢性病危害的有效办法,只有通过定期的体检来尽早发现诊断慢性病。伴随医疗信息化的建设不断深入,大部分医疗机构已经存有大量医疗健康数据。在这个前提下,逐渐成熟的人工智能技术为慢性病早期的筛查和诊断提供了有力的工具。近年来,针对各类慢性的研究逐渐增多。本文以体检数据为研