论文部分内容阅读
随着大数据时代的来临,数据的需求引起了爆发式的增长,而图像数据又是一种重要的表达方式。虽然在互联网上产生的图像数据总量不断增长,获取图像数据的方式便利,但图像数据的质量却不一定都有保证,如图像数据样本数量少、样本类别稀少或样本类别不平衡等问题都会给数据生成工作带来难度,并且目前图像数据的生成依然高度依赖人工要素,导致成本高昂且效率低下。数据增强技术针对图像这种高维数据,传统的方法虽然一定程度上可以增加图像样本数量,但大规模的生成图像样本则会增加过拟合的风险,往往效果有限。本文受到生成对抗网络(Generative Adversarial Network,GAN)近期成果的启发,提出了两种数据增强方法。所做的主要研究工作如下:(1)本文首先详细阐述传统的数据增强相关方法,其次深入研究卷积神经网络(Convolutional Neural Network,CNN)、GAN的相关基础理论及图像数据增强领域的研究难点。(2)提出了一种基于监督学习的条件自我注意生成对抗网络数据增强方法。针对生成指定类别的图像问题,该网络模型受条件生成对抗网络(Conditions GAN,CGAN)监督思想的启发,在生成器和判别器中引入条件变量,使用额外信息指导数据的生成过程。并借鉴自我注意生成对抗网络(Self-Attention GAN,SAGAN)的优点,引入自我注意力机制。针对网络的性能和收敛速度等问题,引入用于衡量图像像素级差别损失中的L1损失函数,使得网络在注重图像特征信息的同时兼顾图像像素信息的重建。(3)提出了一种基于迁移学习的空间注意星型生成对抗网络数据增强方法。针对图像细节信息变换问题,该网络在生成器中加入空间注意力机制,使得输入图像和目标域之间具有相关性,保留域无关的区域。针对训练不稳定与梯度消失的问题,在损失函数中引入Wasserstein函数作为正则项,加快网络训练的收敛速度。(4)本文在四个数据集上进行实验,采用图像质量评价标准对生成样本进行定量分析,还进行实验并对比生成样本在分类器上的识别率,验证了提出方法的有效性和可行性。