跨模态人脸图像生成方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:wuhaha_123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能移动设备和互联网走进千家万户,不同风格的人脸照片图像在专业领域以及人们日常生活中都十分常见。例如照片风格和素描风格的人脸图像,可见光和近红外风格人脸图像等,因此经常需要对不同风格的图像进行相互转化。譬如,从人脸照片图像生成对应的素描人脸,以满足数字娱乐或专业领域的实际应用需要。自动的跨模态人脸合成旨在将人脸图像在不同风格下进行转化,作为目前具有挑战性的一项任务,具有重要的研究意义。目前针对此项任务提出了很多方法,但是仍然在视觉效果等方面存在不足。本文针对跨模态人脸合成进行算法改进。首先提出基于引导图像滤波的两步细节增强算法,第一步是基于KNN的基准算法,对测试图像小块在训练集源模态图像中搜索与其最相像的图像小块,并利用与之对应的目标模态图像小块进行线性组合,以此估计测试图像小块的目标模态初始合成结果;第二步对初始合成结果应用引导图像滤波,将输入测试图像作为引导图像,以此弥补以往算法面部细节缺失的不足。通过定性的实验评估,该方法在保持全局特征基础上能够有效增强面部细节,例如能有效恢复头发纹理、瞳孔亮光等细节。第二,在此基础上,进一步提出结构化细节增强跨模态人脸合成算法,主要思想是对面部五官和其他部分采用不同的合成策略,从而有效地解决面部五官的合成上缺失阴影细节的问题。第三,针对某些测试图像的合成结果存在面部五官位置偏差的现象,通过实验分析发现是由于训练集源模态和目标模态五官并非完全对齐,因此提出基于对齐训练集来改善实验结果的策略。同时,针对素描人脸图像改进面部特征点算法,并将其应用到对齐数据集上,该方法可以有效改善面部五官合成位置偏移、轮廓不清晰的问题。本文还将对齐训练集也应用到基于卷积神经网络的算法上,基于生成损失和判别损失来刻画损失函数,利用面部五官位置对齐的数据集对预训练的模型进行精调,实验结果表明能够取得一定的视觉效果提升。另外,将本文的三种方法与当前经典的算法进行对比,从视觉效果、定量分析、运行速度等方面进行总结分析,归纳出各个算法的优缺点。
其他文献
在家庭环境中应用多元化的无线传感器产品,已经成为当前无线传感器网络(WSN)技术和智能家居结合发展的一种趋势。而家庭无线传感器网络(HWSN)技术的广泛应用将衍生出大量的家
随着网络和多媒体技术的发展,数字作品的版权保护和真实性认证成为人们的迫切需求。本文研究基于水印的数字图像版权保护和内容认证相关算法及应用,力求面向应用实际需要,在理论
随着Web服务的发展,组合Web服务应用领域越来越广泛。然而,组合Web服务本身可能由来自不同地区不同级别的服务组成,远程原子服务的不确定性以及不稳定的网络环境等因素难以保
和传统的鼠标、键盘等人机交互设备相比,手势是更自然、更便利的交互方式。基于手势的实时人机交互在虚拟现实领域有着重要的理论和应用价值,它可以用来实现三维鼠标以及用于
近几年来,以欺诈、篡改、盗窃电子数据为表现形式的高科技犯罪手段与日俱增,计算机取证技术已经逐渐成为当前的研究热点。但是目前计算机取证技术研究,主要集中在电子数据的
快速发展的因特网为人们提供了丰富的信息资源。虽然人们可以在因特网上通过搜索引擎找到他们所需要的信息,但是在获得信息的同时,也附带来了大量的无用信息,需要他们进一步
本文对教师资格证书网上申报系统进行了研究。师范类毕业生申报教师资格证书是学院(河源职业技术学院)每年必须做的毕业工作,该项工作的任务量大、时间紧、数据要确保准确无误
随着数据量的爆炸式增长,传统的关系型数据库管理系统已经无法应对大数据时代数据处理的要求,人们迫切的需要一种能够对海量数据进行存储和运算的工具,Hadoop在这种环境下应
随着应急领域的信息化建设不断发展,全国各地政府都建立了各种应急信息系统,在应急管理和事件突发后的应急响应过程中发挥了重要的保障作用。然而在这些信息系统的建设中,存
嵌入式Web服务器是随着嵌入式系统技术的不断发展与因特网技术互相结合而产生的。与传统的服务器相比,嵌入式Web服务器具有结构简单、体积小、可靠性强以及灵活方便的特点。