基于深度特征编解码的人脸替换方法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:ljyrabbit
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度伪造专指基于人工智能的人体图像合成技术,此技术可将已有的图像或视频叠加至目标图像或视频上,用以制造虚假的多媒体信息。人脸替换是深度伪造的一个重要领域,它的基本任务是将目标人物图像的身份特征替换为源人物,同时保留目标人物面部表情、头部动作、纹理细节、背景光照等属性特征。人脸替换可以广泛地应用到影视制作、人脸匿名、在线会议等领域。传统的人脸替换方法依赖于大量的人工操作,耗时长、效率低,而且替换的结果存在明显的瑕疵。随着深度神经网络的发展,图像合成领域取得了重大突破,目前主流的人脸替换算法都基于深度神经网络,但依然存在脸部细节失真、姿态表情失真等缺点。针对上述问题,本文设计了基于深度自编解码器的人脸替换网络结构,构建了基于大规模欧亚人脸数据库的预训练模型,解决了现有方法在人脸重构过程中信息大量丢失导致的脸部细节、姿态表情失真的问题,主要工作如下:(1)实现了一种基于深度特征自编解码器的人脸替换模型,以提高合成人脸的逼真度。该模型由深度特征编码器、身份特征解码器和属性特征解码器组成,人脸图像通过编码器提取特征向量,身份特征解码器用于重构身份特征,属性特征解码器用于重构属性特征。实验结果表明,本算法生成的替换人脸在结构相似度、姿态相似度、表情相似度、属性相似度、视频连续性上均优于目前的主流算法。(2)围绕人脸替换的实际应用,实现了一套自动化人脸替换系统解决方案。首先构建了一个覆盖了不同肤色、人种、性别、年龄的大规模人脸图像数据库,用于通用模型的预训练,提高模型的泛化能力;预处理过程进行了人脸检测、对齐和分割,滤除了背景的噪声干扰;后处理过程使用泊松融合和颜色迁移,用于替换人脸的无缝贴合。(3)从模型自身结构的角度提升泛化能力而不是通过训练集的扩充迭代,本文提出了一种基于深度特征自编解码器的人脸替换模型,通过将输入图像的特征编码在正态分布中采样,解决了自动编解码器过拟合的问题,提高了模型的泛化能力。实验结果表明,变分自编解码器可以生成训练集中没有的面部姿态、表情动作。
其他文献
随着现代社会的飞速发展,精密测量技术在军事、工业及医学等各大领域发挥着越来越重要的作用,而传统的脉冲法以及相位法等测量技术由于各自的缺陷较难满足高精度与高灵敏度的测量需求。调频连续波(Frequency Modulated Continuous Wave,FMCW)激光测量技术具有灵敏度高、精度高、抗干扰能力强等优点,成为近年来精密测量领域的研究热点。本文以FMCW激光测距为基础,以提高测距分辨率
学位
特发性肺纤维化是成人最常见的一种间质性肺疾病,患者预后性较差,中位生存期为3-4年。对特发性肺纤维化进行早期诊断,可以引导抗纤维化治疗,从而延长患者生存期,减少急性恶化。现有的人工诊断方式,需要医生具有较高的专业知识和丰富的临床经验,并且阅读大量数据对医生的注意力和精力来说是个很大的挑战。目前学术界特发性肺纤维化自动检测相关研究较少,尚无可用在临床上的计算机辅助检测系统。特发性肺纤维化病变区域大小
学位
近年来,由于数据量的快速增长和计算机性能的发展,深度学习已经广泛应用于许多领域,包括安防监控、计算机视觉和推荐系统等场景。目标检测是机器视觉领域中的重点研究方向之一,不断地改变着人类的生活方式,在智慧医疗、异常事件检测和交通流量监控等方面有重要的研究价值。YOLOv5s作为目前最流行的目标检测器之一,存在特征表达能力不足的问题。针对该问题,本文设计了一种基于特征优化的目标检测方案,提出了一种基于特
学位
本文设计了一种60 GHz串并联混合馈电毫米波平面阵列天线,并采用了切比雪夫综合法将其主副瓣电平比控制在-26 dB以下,为了获得更高的增益采用8×10个阵元组阵。该毫米波平面天线阵列的谐振带宽为57.46 GHz~61.87 GHz,工作带宽达4.41 GHz。在60 GHz处工作,平面阵列天线增益最高达15.87 dB,半功率波束宽度为12.78°。该阵列天线在60 GHz毫米波通信系统中可以
期刊
图形符号的检测作为目标检测的热门研究内容之一,研究意义重大,应用前景广泛。随着社会需求的不断产生以及目标检测技术的研究发展,涌现了越来越多图形符号检测的相关技术,并在物流运输、工厂作业、安防、辅助诊断等方面有着很高的应用价值。但是实际场景中,图形符号的检测也面临较多问题,如图像质量差、目标尺寸小、光照影响、检测速度慢等,都会对其检测效果造成影响。本文主要对复杂背景下的图形符号检测进行研究,分别选取
学位
糖尿病视网膜病变是世界上四大主要致盲疾病之一,对其进行诊断可以预防病变以及确认病变的严重程度,从而采取符合病情的治疗手段。然而传统诊断方法效率低下,需要医生有着足够的临床经验。使用计算机来辅助检测时,血管、视神经盘、黄斑等生理结构与糖网病变具有相似的颜色、纹理等信息,并不易于实现病灶分割。尤其是病变阶段中产生的软性渗出,由于其自身的形态特性与纹理特点,有时容易与硬性渗出、视盘等区域混淆,有时又在眼
学位
第四次技术革命引发了社会的深刻变革,人类正在步入一个更加智能化的时代。科学技术创新推动了产业结构调整和经济转型升级,新业态不断冲击和解构原有的劳动力市场秩序,也对人的职业素养提出了新要求。作为与经济、社会联系最为紧密的教育类型之一,高等职业教育肩负培养高素质、高水平的技术技能型人才的重任,在经济发展与产业转型升级的过程中发挥着不可缺少的作用,同时在新一轮技术革命中,也不可避免地受到人工智能发展的影
学位
以石墨烯和过渡金属硫化物为代表的二维材料,因其单原子层结构,具有极其敏感的化学和生化传感特性。为了提高生物分子检测的灵敏度和减少环境对生物分子识别的干扰,堆垛异质结成为了一种制备高灵敏电子传感器或光学传感器的有效方式。本文旨在设计、制备基于二维材料的、具有高生物传感性能或局部场效应发光性能的垂直场效应石墨烯晶体管(Graphene Vertical Field-Effect Transistor,
学位
表面增强拉曼光谱(Surface-Enhanced Raman Scattering,SERS)作为一种灵敏的光谱学分析工具能够提供样品化学分子的指纹信息,常被应用于分子检测、生物医药和环境科学等领域。主流的贵金属SERS活性基底虽然具有较高的增强因子,但存在高成本、制备复杂等缺点,因此基于半导体材料的SERS活性基底因其低成本、高灵敏度和高生物相容性等优点而开始得到广泛关注和研究。WO3-x半导
学位
随着信息时代的发展,大规模的数据与复杂数据分析方法对查询引擎的性能提出了更高的需求。连接查询能够从多个关联的数据表中抽取出有价值的信息,是当前主要的查询方式。Spark并行计算引擎作为流行的大数据处理框架,使用Spark SQL组件处理结构化数据查询,能够将输入的SQL查询语句经过优化后转换为Spark程序执行,有效地利用了Spark处理大数据任务的优势。然而Spark SQL在优化连接查询时仍然
学位