基于生成模型的对抗样本生成研究

来源 :河北大学 | 被引量 : 0次 | 上传用户:foranjay
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年,深度学习作为一种人工智能技术取得了前所未有的发展,在许多领域都取得了巨大的成功,展现出了强大的应用潜力。然而,最近的研究表明深度神经网络(Deep Neural Networks,DNNs)模型容易受到对抗样本的愚弄。所谓对抗样本是指那些通过精心添加一个不易察觉的扰动设计的对抗性样本,对抗样本可以愚弄一些最先进的DNNs模型,导致DNNs给出错误的分类结果,这阻碍了在现实世界中部署DNNs。为了发掘DNNs存在的一些安全性问题,提高其鲁棒性,需要对DNNs模型执行有效的攻击,这要求攻击者保证对抗样本生成质量的前提下,进一步提高对抗样本的攻击性和迁移性。当攻击者面对黑盒模型时,需要依赖对抗样本的迁移性,对抗样本的迁移性代表其执行黑盒攻击的能力。对比基于优化的方法,基于生成模型的方法将对抗样本生成时间转移到推理阶段,尽管,提高了对抗样本的生成效率,但是,在对抗样本的迁移性和攻击性方面不太理想,这就导致其执行黑盒攻击的能力不强,因此,本文的主要工作包括以下两点:(1)基于生成式对抗网络(Generative adversarial networks,GANs),提出了一种用于对抗样本生成的Adv AE-GAN模型。Adv AE-GAN通过自编码器提取易于干扰的关键特征作为对抗样本生成的先验,并对添入噪声的干净样本进行重构,构建对抗样本过程中混合了显式扰动和隐式扰动。最后,为了确保生成的样本清晰、自然,对抗扰动不易被肉眼所察觉,模型引入了对抗学习机制和更加合理的相似性度量标准(Pixel_cross_entoropy,PCE)。这种两阶段的对抗样本生成方法取得了高攻击成功率和良好迁移性,不仅适用于白盒攻击,还能适应难度较大的黑盒攻击。(2)基于改进变分自编码器(Variation Auto-encoders.VAEs),提出了一种新的对抗样本生成方法DCVAE-adv。DCVAE-adv利用变分自编码器(VAEs)强大的建模能力,设计对抗损失函数迫使解码器在正常样本数据分布附近搜索对抗样本,最终实现对抗样本数据分布的学习,实现了无法获取原始样本的情况下,通过混和显式扰动和隐式扰动来构造对抗样本的目的。在推理阶段,不需要将原始样本加载到内存中也能源源不断地生成特定源类别(对抗样本的真实标签)的对抗样本,大大降低了对抗样本的生成难度。DCVAE-adv不仅适用于白盒攻击场景,也适应于难度更高的黑盒攻击。为了验证本文提出的两种方法有效性和优势性,在多个图像数据集下进行了实验,并与多种代表性方法进行对比实验。通过对比生成图像对抗样本的质量、攻击成功率、迁移性以及对抗样本的生成速率,证明了本文提出的两种方法均优于比较的方法。
其他文献
由于在数理经济,模糊优化,过程控制和决策论等科学领域的应用,许多学者致力于将单值测度与积分理论的结果推广到集值环境中,得到集值测度与积分理论相关知识并应用于实际生产生活中.本文对集值非可加测度与积分理论进行研究.首先提出一种新的Banach空间上的集值非可加测度概念,本文称之为弱集值非可加测度,并讨论其性质,接着给出实值函数关于该种测度的积分概念并讨论它们的性质和结构特征.主要的研究内容如下:(1
学位
近年来随着网络平台的发展,图像、视频等数据高速增长,多模态数据的研究与应用价值愈发凸显。这些多模态形式的数据蕴涵着人类丰富的意见与情感信息,具有高度的理论研究意义与实际应用价值。然而在多模态融合策略方面,目前多数融合方法关注于融合的阶段选择或融合的模型选择,缺少完整的多模态融合框架。在多模态表示学习方面,目前多模态表示学习的方法在模型输出时往往采用特征拼接或简单的融合方式,忽略了多模态特征有效融合
学位
异常检测(Novelty Detection)被视为单类分类任务,其目标是检测出数据集中的异常数据。随着数据规模和维度的不断增加,传统的异常检测方法面临计算可扩展性差和“维度灾难”问题。为了解决该问题,传统异常检测方法通常需要大量的特征工程,相比之下,基于深度学习的方法能够自动学习数据中的潜在特征,从而有效解决计算可扩展性差和“维度灾难”问题,有效提高检测性能。因此,基于深度学习的方法在异常检测领
学位
属性约简是粗糙集理论中的研究热点。现有连续值数据属性约简模型的建立主要基于优势粗糙集、邻域粗糙集、模糊粗糙集理论与方法。然而连续值数据属性间不一定具有优势关系;基于邻域关系的约简算法由于属性量纲不同导致邻域半径难以统一,除此之外样本间模糊关系及邻域关系的计算代价一般来说也是较高的。为解决上述问题,本文将聚类粒化方式应用于属性约简过程中,对现有连续值数据属性约简方法进行了改进。提出了基于聚类粒化方式
学位
长尾分布数据分类问题是目前深度学习领域研究的热门方向之一,在计算机视觉领域中被称为长尾识别。长尾分布数据的头部少数类占据了大多数数据,而尾部多数类却占据了很少的一部分数据,当深度学习模型在处理这种长尾分布数据时会偏向头部类,产生很严重的长尾效应。因此,如何解决这种长尾效应是一项很有意义的研究工作。本文的主要工作包括如下两方面:(1)提出了一种基于双向聚类的长尾分布数据分类方法,该方法首先对头部类数
学位
随着深度学习的快速发展,卷积神经网络越来越广泛的应用到计算机视觉领域中。我们通过多步卷积、池化等操作可以实现对特征图的下采样操作,以扩大感受野并提高神经网络的提取能力。然而,在多数的计算机视觉任务里,如在目标检测、语义分割、超分辨率等领域中,对特征图进行上采样操作以保留图像的整体细节也很重要。在传统的上采样操作中,通常在原图像像素间采用插值算法填入新的像素信息。这会出现生成图像目标边缘信息误差较大
学位
随着互联网和电子设备的快速发展,图像、文本、音频等数据正在以不可想象的速度增长,此类数据蕴含众多的信息但无标签,人工为数据标注类别信息的代价大,但是对海量数据的智能管理已然成为一种现实需求和必然趋势。图像聚类分析从数据中挖掘有代表性特征对数据进行分类,在人工智能等很多领域广泛应用,越来越受到研究的重视。现有的聚类算法普遍存在训练误差较大、聚类性能依赖特征表达能力、泛化能力弱等问题。如何设计具有较强
学位
当面对一个分类问题时,如何从众多的可用算法中选择当下问题最适合的算法是一个具有挑战性的问题。相关研究表明分类算法的表现强烈依赖于数据本身的特性,因此人们相信更好地理解数据集对分类算法的研究发展至关重要。元学习将算法选择作为一项学习任务来解决,试图学习元特征和最佳算法之间的映射,而其核心问题在于元特征的构建,即定义哪些数据特征对算法选择最有价值。目前大部分的方法中只考虑了简单特征和统计特征,无法很好
学位
许多机器学习问题都可以表示成损失函数加正则化项的形式,目前最流行的求解方法是以随机梯度下降(Stochastic Gradient Descent,SGD)为代表的随机梯度优化算法。然而,最常用的小批量或单样本的随机梯度下降是计算速度与求解精度的折衷。随机梯度下降的优势主要有两点,一是每次迭代不需要计算全样本梯度,减少了计算量;二是避免由于样本数据过大导致的内存不足问题。但是这带来的问题是引入了随
学位
图像聚类是机器学习和计算机视觉中一项关键而又具挑战性的任务。传统的聚类方法,如K-Means,谱聚类,凝聚聚类等已广泛应用于各类任务,并取得了不错的结果。但对图像等高维数据进行聚类时,由于很难抽取到可判别的视觉特征表示,往往无法得到满意的聚类结果。为了解决该问题,很多研究者提出使用不同的深度卷积网络学习图像数据的特征表示,并结合传统聚类算法,实现图像数据的深度聚类,且已取得了较好的结果。本文主要基
学位