基于GAN和CNN模型的人脸画像合成方法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:efox_5
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
异质图像合成是指对各种不同来源人脸图像之间进行转化与合成,比如不同光照变化下相机拍摄的人脸照片、画家手绘的素描画像、软件合成的人脸照片以及红外成像设备采集到的红外图像。近年来,应用在数字娱乐领域的异质图像合成以及应用在执法领域中的素描画像的合成与识别受到了极大的关注。人脸画像合成主要是指通过输入的照片生成相应的素描画像,主要通过一些合成方法对画像-照片之间的复杂映射关系进行建模,并利用所学习到的映射关系来合成输入照片所对应的素描画像。在理想情况下,合成的画像或照片图像应该保留更多的外观纹理,并且越逼真越好。这样,它才具有良好的视觉感知质量和较高的识别精度。鉴于此,本文基于深度学习方法开展关于人脸画像合成和识别的相关研究。首先,本文对一些典型的人脸画像合成方法进行了全面的回顾和比较。目前尚未见关于人脸画像合成方法的实验对比和分析的研究。鉴于合成过程与训练模型相关联,现有方法可以分为两大基本类型:数据驱动的方法和模型驱动的方法。根据人脸画像合成过程,数据驱动方法,又称为基于样本的方法,一般包含四个步骤:图像块表示、近邻选择、权重计算以及图像块拼接。而模型驱动方法则直接学习人脸照片和画像之间的映射关系。本文介绍了现有多种画像合成典型方法,并进行了定性和定量的对比分析,得出一些有益的结论。许多现有的画像合成方法直接学习照片和画像之间的映射关系,然而这些方法难以获得画像合成过程中的细节信息。由这些传统方法生成的画像其纹理总是显得粗糙,比如,一些关键区域的细节不够细腻。为了解决这些问题,我们基于深度学习方法提出了一种新的人脸画像合成框架。它由两个基于深度学习的由粗到细的人脸合成网络组成。在第一个网络中,我们通过GAN模型得到合成画像的粗略估计,但合成画像容易受到噪声和失真的污染。为此,我们基于CNN模型对画像的细节信息进行估计。基于所得到的粗略图像和细节图像即可得到最终合成的高质量人脸画像。大量实验和分析表明,与传统的深度学习方法相比,我们所提出的方法在人脸画像生成任务中具有更好的合成效果。本文对人脸画像合成方法的性能进行客观评价。对合成图像的质量进行评价以及对合成图像的识别结果进行评价是对合成算法评价的重要手段。通过将合成图像与真实画像进行对比来分析提出了基于结构相似度的合成画像质量评价方法,并构造了加权结构相似性(SSIM)指数作为评价测度,可以是高斯加权的结构相似性指数,也可以是根据经验指定的加权方法。基于人脸画像识别结果也可以用来评价合成算法的性能及合成画像的质量。本文中,我们基于PCA、“特征脸”和基于LDA以及NLDA的方法对人脸画像进行识别实验。其中,NLDA是目前特有的基于特征降维的人脸识别算法。最后,本文总结了人脸画像合成方法的研究结果,提出了一些后续研究的建议,也为未来的研究指出了一些可能的方向。
其他文献
氮化镓材料相对于传统半导体材料具有高击穿场强、高电子迁移率和饱和速度,高温和辐照下高可靠性等显著优势,在电力电子和射频微波电子器件领域展示出巨大的潜力。然而,在常规的横向结构电子器件中,电流崩塌和自热效应等是制约着器件发展的重要问题。在此背景下,纵向结构GaN电力电子器件成为了突破障碍的新方向,其具有功率密度高,可靠性高,热分布均匀等优点。而基于异质衬底的准垂直结构电子器件由于衬底成本低,兼具性能
机器间(Machine-to-Machine,M2M)通信是指在没有人为干预的条件下,机器与机器之间通过通信网络自主地进行数据传输。作为第五代(Fifth Generation,5G)移动通信实现万物互联的主要连接方式,它被逐步地应用到智慧交通、智能家居、电子医疗、远程监控等物联网行业,这使得机器类型通信(Machine Type Communication,MTC)设备的连接需求与日俱增。当大量
海杂波特性研究在雷达探测、海面目标检测及微波遥感等领域具有重要意义。本文主要基于海洋环境参数和深度学习模型研究不同海域的海杂波特性,建立了海洋环境参数与海杂波特性之间的关联模型,并分析了不同海域影响海杂波特性的海洋环境参数因子,为不同海域目标探测、不同波段雷达参数选择及性能提升提供数据和理论支持。本文的主要研究内容及成果特色概括如下:1.本文首先基于欧洲中尺度天气预报中心提供的大量海洋环境参数数据
无人机(UAVs)己成为无线网络的重要组成部分,同时也是5G和未来无线物联网的关键推动因素。UAV作为空中基站,在覆盖范围、连接性和频谱方面提高蜂窝网络性能。无人机机载基站可提供高质量的网络连接并扩展无线蜂窝网络的覆盖范围。此外,UAV可以作为蜂窝网络内的飞行移动终端,支持实时视频流以及物品的递送等多种应用。然而,在UAVs无线通信网络体系的设计和部署中仍然存在许多具有挑战性的问题,如能量和干扰管
半监督学习已经成功地被运用于基于动态数据分析的数据挖掘和机器学习等研究领域之中。非平衡类的学习是分类问题中最具挑战的问题之一。不同于平衡数据,用于模型训练的冗余且不相关的特征会影响分类模型的性能。近年来,学者们大多着眼于非平衡数据的二分类和多分类问题。本文的要点如下。1.提出了一种半监督深度C均值聚类算法(DFCM)用于非平衡数据的二分类和多分类问题,可以用于数据边界不清晰和需要额外参数来减少统计
一直以来,奈奎斯特采样定理是传统信号采样的基础,但该定理理论要求当采样速率达到信号带宽的两倍以上时才能进行信号的精确恢复,由此出现了代替奈奎斯特采样定理的最新却最有效的信号采样压缩处理技术—压缩感知理论。该理论是基于信号的稀疏性或可压缩性,同时实现信号的压缩和采样。它已经成功的被应用到科学领域和工程领域的很多方面,成为了近几年来国内外学者的研究热点。该理论主要包括了信号的稀疏表示、采样矩阵的选取和
在无线通信领域中,网络容量、传输效率、抗干扰能力是无线网络传输的重要指标。中继网络是扩大信号传输覆盖范围、提高传输效率、节约网络资源的有效手段。波束成形技术通过对天线阵列的信号进行加权处理,获得分集增益,提升网络的传输性能。并且,因其波束传输的方向性以及空间滤波性,波束成形技术具有很好的抗干扰能力。因此,结合中继网络研究波束成形技术以提升网络容量与抗干扰性能具有非常重要的理论意义和应用价值。两跳多
近年来,随着计算机和网络技术的快速发展和普及,多媒体数据越来越多样化并在网络和社交媒体上呈现出爆炸性增长的趋势。如何有效管理、检索和利用这些庞大的多媒体数据成为了国内外工业界和学术界共同关注的问题。基于紧致编码的最近邻搜索技术具有占用空间小,计算复杂度低等优点,已经被广泛应用于多媒体数据的管理和分析。在本文中,我们较为全面的研究了面向多媒体数据最近邻检索的紧致编码学习算法。针对单模态和多模态等不同
面对未来无线网络的海量连接、增强移动宽带、超可靠性、低时延等业务需求,兼具照明和通信的可见光通信(VLC)以及兼顾频谱效率和用户体验的非正交多址接入(NOMA)分别成为极具潜力的通信范例与多址方案。由于室内VLC系统中每个光小区内用户数有限、光链路信噪比高、发光二极管(LED)发射角与接收器视场角可调谐、信道状态信息较稳定等特点可与NOMA完美契合,因此,从增强频谱效率和探索新型频谱两个层面出发,
增长性与值分布性质是复函数的两种本质特性.解析函数的增长性刻画、复方程(组)解的增长性估计以及亚纯函数的值分布分析等一直是复分析领域的经典问题.本文从逼近和唯一性两方面讨论复函数的增长性与值分布性质,主要包括全平面内收敛的Laplace-Stieltjes变换和复微-差分方程组解的增长性,多连通域内亚纯函数的唯一性,具体内容如下:1.Laplace-Stieltjes变换的增长性.通过引入有限双下