基于GAN的图像分类方法研究

来源 :上海师范大学 | 被引量 : 1次 | 上传用户:aini123321231
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体技术的飞速发展和大数据时代的到来,图像分类已经成为计算机视觉和模式识别领域的研究热点之一,其中基于深度学习方法的图像分类已经取得了很大的进展。生成对抗网络GAN(Generative Adversarial Networks)作为生成器和判别器的组合,是近年来深度学习领域中为数不多的一项新锐技术。在图像分类方面,GAN凭借可以在训练阶段提取真实图像和生成图像丰富特征的优势正逐渐应用于监督和半监督的图像分类任务中。目前基于GAN的图像分类主要通过对判别器加以改进,来实现图像分类的特征提取。现有基于GAN的图像分类精度还有待提升,原因在于:一方面GAN中判别器的功能单一,特征提取能力偏弱;另一方面GAN本身难以收敛,判别器的非线性拟合能力不足。针对GAN中判别器的特征提取能力单一的问题,本文对GAN的结构进行改进,提出一种具备辅助编码功能的生成对抗网络AEGAN(Auxiliary Encoder GAN)模型。将编码器融入判别器框架,让编码器和判别器共享大部分权重,从而使判别器可以提取到真实图像和生成图像的主要特征,最终使判别器提取的特征更加丰富,改善常规GAN中判别器功能单一问题。此外,针对无标签的生成过程,提出基于AE-CGAN(Auxiliary Encoder Conditional GAN)的图像分类方法,解决无标签生成过程造成的生成样本质量不高的问题。针对GAN中生成器难以收敛和判别器拟合能力不足的问题,提出一种基于领域匹配生成对抗网络DMGAN(Domain Matching GAN)的半监督图像分类方法。首先在现有的半监督GAN的基础上,在生成器中引入真假样本分布的最大均值差异损失,此时最大均值差异损失等效于图像内容损失,指导生成器优化的方向,解决GAN难以收敛的问题;其次在传统判别器的结构中添加卷积区域的注意力机制模块,使判别器学习到模块输入特征图的重要特征,增加判别器的非线性拟合能力,提升判别器网络的分类表现。在MNIST、CIFAR-10、Fashion-MNIST和SVHN数据集上的实验结果表明,与传统基于GAN的图像分类方法相比,基于AEGAN的图像分类方法和基于DMGAN的半监督图像分类方法分别有效提升了图像分类精度。
其他文献
目的:对儿童重症肌无力的临床特征与血清相关抗体进行分析,初步探索儿童MG血清相关抗体与临床特征的相关性,为诊疗方案的选择及预后判断提供依据。方法:收集2017年9月至2019
蛋白质是一类非常重要的生物大分子,在物质代谢、细胞信息传递、个体生长发育等方面均有不可替代的作用。为了行使生物功能,蛋白质必须折叠成正确的天然结构,而错误折叠常常
鲁迅与孔子作为中国两个思想解放、文化转型期的文化伟人,他们都肩负着文化重建的历史使命,面临着人生的困惑,承受着与当时社会悖立的痛苦。本文通过生命哲学、伦理观念、政治理
中韩FTA达成后,承诺将采用准入前国民待遇和负面清单开展服务贸易与投资谈判。考虑到金融服务开放实践的指导作用,文章基于中国和韩国在中韩FTA、中澳FTA和韩澳FTA中的金融服
量刑幅度存在着负效应。由于语言表述不能所导致规则缺失因而缺乏必要的制约,容易出现权力滥用。由于犯罪人在犯罪前无法知道具体的量刑幅度,因而很难对犯罪行为的选择构成制
随着社会的发展,固定资产管理已成为一个企业正常运转不可缺少的组成部分。企业需用一套资产管理系统来管理这些资产,以达到固定资产既不会被闲置,又能充分发挥其最大的作用
帕金森病(Parkinson’s disease,PD)是一种最常见的神经退行性运动障碍,常染色体显性遗传PD可由LRRK2基因的突变引起.总结了LRRK2功能研究的最新成果,分为分子遗传学、表达分
产业投资基金,在国外被称为私募股权投资基金,作为投资基金的一种重要形式,对经济的发展起着巨大的推动作用。现阶段,国外私募股权基金的大量进入我国,在这种形势下,我国大力
唯一经过二次再结晶工艺得到的且主要用于制作变压器铁芯的取向硅钢,和其他金属材料一样,内部的金属组织结构也决定了其磁性能。取向硅钢本身最突出特点是具有极强的Goss织构
广东省作为我国的水禽大省,蛋鸭的养殖数量在近年得到快速增长,但是南方高温高湿气候促使环境中的有害细菌繁殖能力增强,其中热应激和LPS浓度升高导致蛋鸭产蛋性能下降。家禽