论文部分内容阅读
深度学习近年来取得了快速发展。生成对抗网络(Generative Adversarial Network,GAN)是目前深度学习技术中热门的生成式模型。GAN在网络结构上与传统生成式模型不同,除了生成网络外,还存在一个能够分辨样本的判别网络。生成网络和判别网络之间是一种对抗的关系。GAN在计算机视觉领域得到了广泛的研究和应用。除了图像生成之外,将GAN的模型用于图像识别,从而取代传统数据增强方法也是切实有效的。然而在实验过程中模型训练不稳定、难以收敛等问题是影响GAN发展的重要因素。因此,研究改进GAN网络结构方法以及将GAN用于图像识别具有重要意义。本文在分析国内外关于深度学习和GAN发展的研究成果、GAN基本思想、结构组成以及训练方式后,针对原始GAN特征提取不充分、生成样本不可控以及训练过程中出现的模式崩塌和模式丢失等问题,开展了以下主要工作:深度卷积生成对抗网络(Deep Convolutional GAN,DCGAN)在原始GAN的基础上,融合了卷积神经网络(Convolutional Neural Networks,CNN)进行无监督训练。条件生成对抗网络(Conditional GAN,CGAN)基于原始GAN的模型架构,加上条件信息扩展为条件模型。结合DCGAN和CGAN的优点,本文提出使用条件深度卷积生成对抗网络模型(Conditional-DCGAN,C-DCGAN)。该模型不仅能够利用卷积神经网络拥有更强的特征提取能力,并在此基础上为模型的生成器加以条件信息辅助其生成样本。将改进后的结构进行优化并用于图像识别中,实验结果表明,该方法能有效提高图像识别的准确率。在改进的条件深度卷积生成对抗网络模型中,本文利用了谱归一化后的全局权重为模型鉴别器添加Lipschitz约束;使用组归一化对隐含层的输入归一化,加速训练并提高生成样本的质量;采用全局平均池化层代替全连接层来避免模型过拟合问题。该改进方法应用于两个数据集CIFAR-10和SVHN的图像生成和图像识别。实验结果表明,与现有方法相比,该方法不仅可以生成更好的图像,还可以有效提高图像识别的准确性。最后,基于C-DCGAN和SICS-GAN两种改进算法,本文在MNIST手写字符数据集上完成训练后将算法部署在Web端,通过前端页面的手写面板实现在线的手写数字识别系统。