基于自编码器和生成对抗网络的图像识别方法研究

来源 :江南大学 | 被引量 : 3次 | 上传用户:mqj0712
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像识别的核心是如何学习到判别性强,鲁棒的图像特征。性能优良的特征有助于图像识别与分析。但因图像内容非常复杂,易受遮挡、光照、尺寸、形变等因素的影响,获得判别能力强的特征非常困难。如何能够有效地提取图像特征,目前仍然是人工智能,模式识别和计算机视觉等领域研究的重点内容之一,本文以自编码器和生成对抗网络两种模型为基础框架,研究了深度学习方法在图像特征提取及其在图像识别中的应用。深度学习具有强大的,从一般抽象到高度抽象的多层次数据表征能力,它持续吸引着众多的研究人员和资金投入其中。虽然深度学习已经在图像,语音和信号处理等多个领域都取得较好的成绩,但是仍然存在一些问题和需要改进的地方,比如如何将鉴别信息有效地嵌入到特征学习中,如何将大量的无标记数据融入到有标记数据中统一地进行学习,如何提取到可解释的数据表示等问题,本文主要针对以上问题,提出几种基于自编码器和生成对抗网络的深度学习方法来提高模型的泛化能力。本文主要工作包含以下几个方面:(1)提出了一种标签一致性约束的稀疏自编码器模型。自编码器是一种具有快速推理结构的神经网络模型,如稀疏自编码器,非负约束自编码器等,但是这些自编码器都忽略了数据之间的关系,不易学习到鉴别性强的特征。针对以上问题,本文提出一种标签一致性约束稀疏自编码器模型,这种自编码器在特征学习的过程中,通过惩罚数据特征到其类中心的距离,将中心损失加入到损失函数中,使得数据在重构的过程中,能够学习到数据的鉴别性结构信息。另外还可以将这种浅自编码模型堆栈成深层模型,通过对深层网络预训练加微调的方式,进一步提高该模型的多层次抽象特征学习能力。不同数据集上的实验验证了标签一致性约束有助于提高自编码器提取到具有鉴别性的图像特征,是一种有效的深层模型初始化策略。(2)提出了一种图拉普拉斯约束的阶梯网络模型。阶梯网络是一种以深度自编码器为基础框架的深层次网络模型,这种网络能将监督学习和非监督学习融入到同一个框架中进行学习,这种半监督学习的策略有助于提高监督信息的利用效率和非监督特征学习的判别性。为了进一步将流形结构嵌入到阶梯网络中,本文将图拉普拉斯矩阵引入到这个模型中,提出了基于图拉普拉斯流形正则化约束的阶梯网络,这种网络将所有样本,包括有标记样本和无标记样本,都映射到同一个图中进行学习。这种约束可在数据重构和特征学习的过程中起到局部约束的作用,进一步提高了阶梯网络的半监督学习能力。在实验阶段,建立了全连接形式和卷积形式的拉普拉斯阶梯网络模型,并在手写数字数据集和物体识别数据集上进行了验证,实验结果证明了该方法在图像识别中的有效性。(3)提出了一种均值与方差特征匹配的生成对抗网络模型。生成对抗网络是一种深度生成模型,这种网络假设所有样本,均是由一个潜在的模型生成的,所以生成对抗网络可用于半监督学习。改进的生成对抗网络(Improved GAN)是一种先进的生成对抗学习方法,提出了特征匹配的训练方法,有效地提高了生成对抗网络的训练稳定性。但是这种方法只将特征的一阶矩均值作为统计变量来进行特征匹配,这样的做法不能很好地描绘特征分布,且不能很好地将原始数据的特征分布与生成数据的特征分布进行匹配,所以本文将特征的二阶矩方差加入到特征匹配的训练中,提出一种基于均值与方差特征匹配的生成对抗网络,这种网络使得生成数据和原始数据的特征匹配度更高,能更有效地抓住数据的流形结构。实验验证了加入方差的特征匹配方法有助于进一步提高生成对抗网络模型的半监督分类性能,在有标记数据量较少的情况下,提升效果更为明显,而且这种网络能生成较为真实的图像。(4)提出了一种用于解耦表示学习的双编码-解码结构的生成对抗网络模型。为了得到可解释表示,解耦表示学习常常用于分析深层神经网络。本文以人脸数据为例,论证了生成对抗网络的解耦表示学习能力,并分析了解耦后的特征有助于提高鲁棒性。解耦生成对抗网络(DR-GAN)能将人脸身份信息从姿态属性中解耦出来,然后利用解耦后的人脸表示进行人脸识别,提高了人脸表示在抗姿态干扰方面的能力。但是这种方法存在缺点,第一,DR-GAN使用传统的真伪判别作为其对抗函数,不利于模型的训练稳定性和收敛速度,第二,这种方法利用独热向量(One-Hot Vector)来表示姿态,丢失很多姿态细节信息,而且这种离散的表示,忽略了姿态呈连续性变化的潜在属性。针对以上问题,本文提出了双编码-解码结构的生成对抗网络,这种网络利用自编码器来作为其判别器的一部分,引入了基于像素损失的对抗学习方法,有助于提高模型的训练稳定性和生成真实图像的能力。用一个连续性变量来表征人脸姿态,作为先验加入到模型训练中,并用回归代替分类的方式对其姿态进行评估,这种方式有助于提升模型的解耦表示学习能力。实验结果表明,所提的方法在姿态不变人脸识别和生成跨姿态人脸的任务上都有较好的表现。
其他文献
当前,司法机关的信访工作面临十分严峻的形势。据统计,最近五年来,全国司法机关来访人数和批次都呈连续增长趋势。在信访工作中,大部分来访来信,经过做一定的教育疏导和解释
介绍了国内外粮食发酵制醋酸技术的研究进展,包括固定化细胞发酵技术、膜技术等.随着绿色化学和生物工程技术的发展,该技术将会引起更多的关注.
犯罪是全社会的问题,犯罪的实施主体是全社会各行各业的人,犯罪的生成因素其中就包括社会因素,而罪犯的改造质量好坏、再社会化程度高低影响着整个社会的安定,所以说治理犯罪应当是全社会的责任。具体来讲,执行刑罚惩罚罪犯是监狱的职责,改造罪犯则是全社会的责任。需要强调的是,监狱作为社会的一个行业,需要得到全社会的理解和支持,尤其是改造罪犯实现罪犯再社会化需要得到全社会各行各业的积极配合。监狱是政府的公共职能
我国《刑事诉讼法》首次以立法形式确定了未成年人犯罪记录封存制度,这是我国未成年人在刑事司法制度发展中取得的一次重大进步。司法实践过程中,需要明确犯罪记录封存制度于
永磁同步电机(Permanent Magnet Synchronous Motor,PMSM)因其高效率、高功率密度等优点,已被广泛应用于现代工业及航空航天等领域。永磁同步电机作为机电能量转换机构,若发
本文介绍了长江港口企业发展和财务现状,依托财务战略矩阵模型,对比长江沿线港口企业财务绩效,以此为基础分析了长江港口企业发展中存在问题,并提出相关对策和发展建议,以期
素有"煤铁之乡"之誉的山西,随着20世纪80年代以来矿产资源的掠夺式开采及原材料工业的粗放生产,成为全国工矿区土地与生态环境破坏最严重的省份之一,矿区土地复垦迫在眉睫且意
本文利用2004年和2008年两次经济普查数据,研究了员工性别间数量结构与技能结构对企业生产率的影响。研究结果发现,员工性别间存在数量互补和技能分工现象,但在行业及企业间
微量元素铜对眼的作用早为人们所关注,近年来随着微量分析技术的发展,人体有关铜的基础研究方取得进展。微量元素铜是人体不可缺少的元素,具有特殊的生理和生化的作用。铜常
背景:肺癌的免疫靶向治疗,如检查点抑制剂的应用,已经使肺癌治疗取得了里程碑式的进展。免疫检查点抑制剂的抗瘤机理并非直接靶向消灭肿瘤细胞,而是通过去除T细胞上的抑制性