图像分类中的对抗样本攻击与防御技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:abcd_11840
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在图像分类任务中原本可以被正确分类的图片,在添加一些细微的非随机扰动后形成的新的图片却使得深度学习分类模型以高置信度分类错误。更令人沮丧的是在同一训练集的不同子集上训练得到的具有不同设计架构的模型竟然都会对相同的对抗样本实现错误分类。对抗样本的存在使得深度学习在安全敏感性领域的应用收到了严重威胁,比如最近比较热门的自动驾驶。试想如果自动驾驶系统在驾驶时将停止标示误识别为前进或者左转,这对客户而言将会是多么危险的事情。然而最新的研究表明这确实是可能的。为了推动深度学习进一步在现实世界中安全性的应用,学术界有必要对对抗样本的产生以及如何进行有效防御这两个关键技术进行深入的探索和研究。  本文的创新点主要有:  针对已有对抗样本攻击算法速度慢或者迁移性差的问题,本文提出一种基于自编码器的对抗样本攻击算法。该算法利用自编码器强大的自我学习表达能力,通过设定特定的损失函数使其自动学习产生对抗样本。最后我们在MNIST、CIFAR10和ImageNet三个公开数据集上分别验证了攻击算法速度快和迁移性强的特点。另外通过修改损失函数的设计,本文提出的攻击算法可以实现多种形式的攻击。  针对已有对抗样本防御算法不够鲁棒的问题,本文提出一种基于扰动消除思路的对抗样本防御算法。根据单个图像容易被修改,但是所有图像所形成的分布很难被修改,提出利用对抗生成网络实现一种借助数据分布来去除图像中的扰动的防御新算法APE-GAN。并在MNIST、CIFAR10和ImageNet三个公开数据集上分别验证了本研究提出的防御算法的鲁棒性——可以有效降低各种攻击算法对目标模型的错误率,而且不需要对目标模型进行任何修改。  在未来的研究工作中,我们会把本研究提出的攻击算法与防御算法利用生成对抗网络的思想进行对抗优化学习,从而得到一种鲁棒性更强的防御算法。
其他文献
提高软件可靠性是软件开发的重要课题之一。软件可靠性手段包括分析、测试和验证等,其中测试的投入往往占系统开发总成本的很大比例,因此测试效率的提高可以有效缩减成本。但
随着我国城市化进程的不断加快,铁路客运市场需求不断快速增长,传统的人工售票方式已经难以满足大流量旅客快速乘车购票的需求;另一方面高速铁路客运专线建设尤其是京津客运
随着新时期军队的数字化,具有快速、高精度、高稳健性等突出优势获取DEM数据的多基线InSAR技术,已经成为获取虚拟战场地表信息最具潜力的观测新技术之一。但目前国内外多基线
随着Internet的快速发展和普及,网络化应用大量涌现。Web应用是Internet中典型的应用,近年来也出现了多种被业界概括成Web2.0的应用类型。Web2.0应用包括博客(Blog)、播客(Podc
模式识别技术已经在社会的各个领域发挥着巨大的作用,是一个具有重大科学意义的研究领域。信号波形轮廓形态的分析和识别是模式识别应用中的一个重要技术,具有广泛的应用。句法
现实世界许多应用中的数据,不是有限的离散数据集,而是无限的连续数据集。这种由连续、无限、随时间变化的数据项组成的有序序列被称为数据流。数据流的到达速度及数据量一般是
互联网科技蓬勃发展,新技术术语层出不穷。云计算、大数据、物联网等信息通信技术的发展,互联网+与各领域的融合,AI浪潮推动使互联网行业的竞争格局新变化。及时发现互联网新技
随着Internet的不断发展,网络上的在线数据库越来越多,许多用户可以通过Web站点提供的查询接口来访问Web数据库中的信息,这种在Web中可通过查询接口访问的在线数据库,被称为Web数
软件开发的成败与需求的质量有紧密的关系。充分获取和理解用户的目标和需求,并采取有效的方法支持多涉众(用户、项目经理、开发人员等)间通过协商就需求达成共识,对软件开发的
在经历了主机(mainframe)时代和个人电脑(personal computer)时代后,随着嵌入式设备、无线网络等技术的蓬勃发展,信息空间与人们生活和工作的物理空间逐渐融合,普适计算这一新的