面向恶意软件对抗样本攻击的可信人工智能防御方法研究

来源 :武汉大学 | 被引量 : 0次 | 上传用户:jklbnm123jkl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在经济利益的驱动下,恶意代码相关的安全事件日益频繁。根据AV-Test的恶意代码统计数据,平均每天新发现25万多个新的恶意代码样本,与此同时恶意代码在快速进化。面对日益复杂的环境,人工分析已经难以及时应对如此海量的恶意代码。因此,人工智能技术被广泛的应用到恶意代码分析与检测系统中,人们开始广泛利用人工智能对大量的恶意代码样本训练检测模型。然而随着人工智能模型的广泛应用,人工智能本身的可信性受到了挑战,令其可能成为系统中薄弱的一环。在人工智能面临的诸多挑战中,对抗样本问题显得尤为严峻。传统机器学习模型大多基于一个稳定性假设:训练数据与测试数据近似服从相同分布。但是,当罕见样本甚至是恶意构造的非正常样本输入到机器学习模型时,就有可能导致机器学习模型输出异常结果。利用这一事实,通过构造对抗样本,攻击者可以间接干扰人工智能服务推理过程,进而达成误导分类、逃避检测等攻击效果。并且攻击者不需要目标模型的大量信息,即使是黑盒攻击也可以转化为白盒攻击,因此攻击手段隐蔽简单且高效。同时,由于对抗样本问题目前是人工智能模型黑箱的一部分,所以无法有效绕开。针对对抗样本问题,在计算机视觉领域,已经对此有了较多的研究,包括攻击与防御方法。然而在应用深度学习的恶意软件检测领域,人们往往只执着于分类效果的好坏和模型的有效性,而忽视了恶意软件检测系统模型本身的可信安全问题,这必然为人工智能技术在安全领域的应用前景埋藏了一个潜在的危机。为此,基于以上恶意软件人工智能检测领域所存在的问题,本文基于字节级恶意软件检测模型开展了针对对抗样本攻击的可信防护研究。通过对恶意软件输入空间的固定特征与运算过程中神经元不变量的可信防御分析,从两个不同角度对对抗样本开展防御方法设计。同时,本文基于tensorflow实现了上述防御方案,实验结果表明,该多层次可信防护方案可以有效识别对抗样本,相比于同类相关工作,具有低误报率和漏报率,从而验证了我们方案的有效性和高效性。本文的主要贡献包括:1.针对现有的恶意软件对抗样本防御方法中主要局限于图像领域的沿袭,缺乏与恶意软件自身特性相结合的问题,开展了在恶意软件输入特征层面的可信对抗样本防御研究,提出了一种基于输入空间恶意软件固定特征的可信防御方案TCFD。我们用代表恶意软件恶意行为的固定特征作为可信基对输入进行检测,实现了人工智能系统在恶意软件检测领域的输入层可信防护要求。2.针对当前恶意软件对抗样本防御方法只关注样本输入特征层面研究,而存在对于模型数据流缺乏分析的局限性问题,开展了计算过程中基于不变量的对抗样本可信度量研究,提出了一种新的不变量寻找方案BVI。通过在深度学习模型运行过程中,利用传统安全中边界检查的思路,基于神经元分布的情况作为不变量,实现了过程可信防护要求,与之前通用领域的不变量防御方案相比,本方案开销更小,适用性更强。3.基于以上研究,使用tensorflow实现了上述防护方案,采用多模型融合手段,通过三种强恶意软件对抗样本攻击测试集,上述可信防御方案可以有效监测出对抗样本,同时保持正常样本的分类,能够有效发现防御对抗样本攻击,同时具有极低的误报漏报率。
其他文献
目前,我国的农村土地使用权流转主要是政府引导下的农民自发行为,形式比较多,程序比较乱,存在问题也比较突出,因此,急需政府科学引导。农村土地使用权流转问题也引起了党中央、国务院的高度重视,党的十八大、十九大以及乡村振兴战略、历年来的中央一号文件都对该问题进行了强调。农村土地使用权流转关系到农民的切身利益,且各地的情况不同,因此需要高度重视,及时发现存在的问题,分析原因,提出解决对策并付诸实施。泸州市
情感作为人类表达和交流的重要部分,要使计算机理解和识别人类情感具有重要的研究意义和应用价值。情感识别研究主要分为单模态情感识别和多模态情感识别两种,按照情感识别类型又可分为离散情感识别和连续情感识别。离散情感识别将情感类别作为识别目标,忽略了情感复杂性和情感粒度,而连续情感识别通过建立情感空间将情感强度值映射为具体的情感属性,有效克服了离散情感识别的缺点,使得情感识别更精确。又由于单模态情感识别存
随着信息技术的迅猛发展,信息在组织中的重要性日益凸显。在通过对组织信息结构的研究,对于组织内部信息获取、传递、协调的配置上提出了信息结构的概念,并指出有效的信息结构不仅可以极大的提高员工的决策能力,也可以提升员工和组织的适应能力。以比特币为主的数字货币的火热,使得人们逐步开始认识到其底层的区块链技术。区块链技术以信任为出发点,改变了互联网模式下的信任机制,提出了去中心化和信息可溯源的特性。同时也为
近年来,随着信息技术的高速发展和智能终端的普及,室内定位技术逐渐成为了研究的热点,在全球范围内有着巨大的市场需求。目前基于智能手机的定位系统多以PDR定位作为主体,然而PDR定位存在误差累积问题,地图信息是室内定位中的重要辅助信息,既可以展示定位结果,也可以作为辅助信息约束定位,因此基于地图信息约束的室内定位技术具有重要的研究价值。本文基于地图信息中的空间信息、结构地图信息和轨迹地图信息为约束信息
进入21世纪以来,随着人民生活水平的提高,医疗问题日益成为人们所关注的重点,人们对优质便捷的医疗服务的需求日益增长。在科技高速发展的今天,移动通信技术、互联网技术和医疗服务逐步走向融合是大势所趋。集数据分析、移动通信、计算机网络于一体的移动医疗技术对解决当今世界医疗供需不平衡、医患沟通不及时、医疗相关数据保存不完整等问题有着巨大的帮助。尽管近年来移动医疗发展迅速,给人们的生活带来了许多便利,但是随
对?二烯类化合物如柠檬烯、紫苏醇和紫苏醛等在自然界中分布较为广泛,通常用作萜类香料,在医药和农药等领域也有一定的用途。目前,关于对?二烯类化合物的研究还不够深入,深加
海运在世界上发挥着重要作用,但是随着很多沿海和港口的水域交通密集,状况复杂的情况日益严重,海上交通事故频发问题亟待解决。因此,探索船舶航行规律和航迹可靠性预测对船舶航行的安全保障、航迹规划和风险预警具有重要意义。从卫星捕获自动识别系统信息能够从船上接收导航信息,例如位置、航向、速度、目的地等,为船舶的跟踪预测提供了信息基础,大大增强了海上监视能力。本文针对基于自动识别系统信息的船舶航迹预测进行研究
达西渗透流速场对于地下水环境评估、污染防治等领域的研究具有重要意义。连续、稳定、精确的地下水达西渗透流速场,能够准确描述对流项,提高对流-弥散方程的模拟精度,是建立精确描述地下水溶质运移模型的关键。然而,有限元法等传统方法在模拟达西渗透流速时,是通过直接求解水头的一阶导数获得节点达西渗透流速的。这些方法所获得的水头的一阶导数值在单元节点上不连续,无法保证达西渗透流速的连续性,因而会导致截面的流入量
农业是国家的基础产业,农产品是人最基本的食物来源。作为种植业的第二大产业—蔬菜产业,蔬菜是人日常生活的必须品,东北冬日严寒,要想保证全年稳定的蔬菜生产,设施蔬菜产业是必不可少的。当前,我国设施蔬菜产业根据供给侧结构性改革,向优质、安全、方便的方向加快发展。设施蔬菜产业是凡河镇的主要农业产业,凡河镇依据品种、环境、市场等优势条件,因地制宜发展西红柿、黄瓜、菠菜等品种,2013年后设施蔬菜成为凡河镇支
当前国家经济正在转型,经济增长速度有所减缓,虽然大形势下经济发展是乐观的,但是国内经济的运行仍然面临很大的压力,要缓解这种压力,从企业出发,要先保证其自身的良好发展,而这建立在企业能够拥有较高的投资效率的基础上的。企业融资活动和投资活动是企业经济运转的两项基本活动,能否作出合理的投资决策直接影响企业的投资效率,对企业的发展产生重大影响,需要引起企业足够的重视。同时,企业处于生命周期不同阶段所进行的