跨域图像转换技术及其在人脸漫画生成中的应用研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:remine
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
跨域图像转换是指将某一图像域的图像转换为另一图像域中的图像,同时保持图像内容不变。而人脸漫画生成可以看作跨域图像转换的一个典型应用,即将人脸照片图像转换为人脸漫画图像,同时保持人脸身份一致。本文围绕这两个任务,针对跨域图像转换中的精准类别保持问题以及人脸漫画生成中的形变多样性问题展开研究,并提出了跨域对抗自编码器和多形变生成对抗网络来解决这些问题。跨域图像转换是计算机视觉领域的基本任务之一,随着深度神经网络的发展,许多基于深度神经网络的跨域图像转换方法应运而生。然而这些方法普遍存在一定的局限性。一方面,现有方法大多将跨域图像转换作为一对一的映射来建模;另一方面,现有方法在图像转换过程中通常将图像的所有形状结构作为内容保持不变,而只改变图像的色彩纹理风格。针对这一问题,本文第一项工作关注面向精准类别保持的跨域图像转换问题,并提出了跨域对抗自编码器(Cross-Domain Adversarial Auto-Encoder,CDAAE)。CDAAE假设图像可以被分解为内容编码和风格编码,其中不同图像域共享内容编码,而风格编码各自独立,从而使模型能够模拟多对多的映射关系。另外,CDAAE假设内容编码服从类别分布,并通过半监督的方式进行训练,使内容编码器能够捕获图像的精准类别信息,进而实现更好的精准类别保持效果。实验表明跨域对抗自编码器在跨域图像转换中能够实现更好的图像多样性和精准类别保持准确性。此外,本文还基于跨域对抗自编码器设计了一种领域自适应算法,并在标准数据集上取得了业内领先的准确率。人脸漫画自动生成方法的研究由来已久,无论是传统方法还是基于深度学习的方法都吸引了大量的研究关注。对人脸形状进行形变夸大是人脸漫画生成中的关键,现有方法通常只从突出人物的个性化特点方面来对人脸形状进行夸大。然而,真实漫画图像中丰富多样的艺术形式和情感色彩造就了其形变风格的多样性。因此,基于第一项工作中图像具有共享的内容编码空间,以及相互独立的风格编码空间的假设,本文第二项工作关注人脸漫画生成中的形变多样性问题,并提出多形变生成对抗网络(Multi-Warping Generative Adversarial Nets,MWGAN)。本文的方法通过风格转换和形变夸大两个步骤来实现人脸漫画的生成,并分别通过风格编码和关键点转换编码来控制生成图像的色彩纹理和形变风格,从而使模型能够根据同一输入照片生成不同色彩和形变风格的漫画。同时,MWGAN还通过双向结构设计来使模型学习编码空间与图像之间的双向映射关系,从而使产生的色彩和形变风格更加合理逼真。另外,为了保持生成漫画与照片的身份一致,MWGAN还同时在图像空间和人脸关键点空间使用了人脸识别损失来训练模型。实验结果表明MWGAN能够根据同一输入照片,生成多种色彩和形变风格的漫画,且生成漫画的质量也高于现有方法。
其他文献
我国矿井设备大多配备10kV电机,主要用于带式输送机、风机、泵等矿用设备。本文以某矿用设备公司开发高压大功率变频器为背景,设计并研制了一台10kV/1200kW的矿用高压变频器。采用国产主板TX8000,通过CPS-SPWM调制技术实现电机的控制,具有输出谐波小,工频以下恒转矩等特点。该矿用变频器的研制可以解决带式输送机的启停,风机、泵等设备的智能调速问题。本文首先概述了矿用变频器的国内外发展现状
手持式观测仪目标指示系统是将红外与微光融合技术和目标定位技术信息融合于一体的新型观察测量系统。它应用于作战和指挥当中可实现目标探测和手动地理定位。这种新型的目标指示技术不但能使目标识别和搜索更加准确,而且使目标定位精度更高。目前,目标指示技术在国内的陆军装备系统中还应用较少,主要应用于车载系统,雷达系统,舰艇作战系统,机载等系统。本文创新性地将目标指示技术应用于陆军装备中,根据手持式观测仪的技术要
Ga_2O_3作为一种超宽禁带半导体新型材料,不仅具有超宽的带隙(高达4.9e V),较高的临界击穿电场(高达8MV/cm),而且在高温下还具有出色的化学、机械以及热稳定性,因此在紫外发射/检测设备、高功率电子器件等方面应用前景广阔。目前对Ga_2O_3薄膜的研究大多集中在β-Ga_2O_3,但由于其为单斜晶体结构,在对称异质衬底(如蓝宝石(0001)和Ga N(0001))上生长高质量的薄膜不够
重金属污染物对人类和其它生物的毒性效应得到人们广泛关注。本文使用氯化汞,醋酸铅,铬酸钾,氯化镉和甲基汞等几种典型的环境重金属污染物对斑马鱼胚胎进行暴露,检测lncRNA birc6-as,malat1,mettl3,setd1ba和oip5-as表达,探讨在斑马鱼胚胎中是否可以筛选出重金属污染物潜在的lncRNA生物标志物。在本研究中,将斑马鱼胚胎置于氯化汞,醋酸铅,铬酸钾和氯化镉暴露液中,暴露至
本文从新闻叙事学角度研究内蒙古蒙古语卫视《喜鹊踏枝》栏目。论文由导论、正文、结论、附录等四个部分组成。导论阐述了本论文的选题理由、目的、研究现状及研究方法。正文由三章组成,第一章概括介绍了内蒙古蒙古语卫视喜鹊踏枝栏目发展、现状、定位及特色。第二章,以实例分析研究了《喜鹊踏枝》节目叙事特点、叙事主体等。第三章对《学鹊踏枝》栏目如何发挥自己的优势、与时俱进、弥补不足、提高节目质量等方面进行了总结归纳。
随着控制理论在各个科学领域的发展以及应用,专家学者们发现许多实际系统由于部件老化以及系统内部故障等经常会导致系统出现参数或结构发生突变的现象。这类系统通常会被建模为混杂系统且应用广泛。众所周知,马氏系统就是一类涉及到两部分机制,且较为特殊的混杂系统。其系统中一种机制随时间变化,并且与系统状态有关;另一种机制是事件驱动机制,系统的操作模态受马尔可夫链所驱动。由于马氏系统很适合去描述工程应用中的动态系
红外探测器在民用军用领域都有非常重要的地位,包括:安防、夜间成像、导弹预警、气象水文探测等等。随着材料制备技术和芯片制造工艺的不断进步,红外探测器正在向高探测率、大面阵、小型化、高温化和多色探测等方面快速发展。诸多应用于高性能红外探测焦平面探测器的新材料体系正在涌现,其中以In As/Ga Sb超晶格为代表的锑化物II类超晶格材料获得了极大的关注。它具有有效质量高、能带调节便利、均匀性好等特征,在
技术的高速发展以及在各个领域的广泛应用给人们的生活带来了极大的便利,同时也使哲学家们把目光转向技术哲学。唐·伊德作为久负盛名的美国现代技术哲学家也对这种影响颇为
近年来,随着国有企业改革的加快,集团层面兼并重组、同质化业务整合和行业龙头企业领导下的行业整合出现。为了进一步促进战略性新兴产业的快速发展,中国铁建股份有限公司对集团内部分子公司进行了机构改革,并对同类资源进行了重组整合。ZG公司和ZB公司是中国铁建股份有限公司的两家全资子公司,它们的整合是扩大产业规模、增强资源整合的集中度、优化国有资本的布局和资源得到有效配置的积极举措。公司的重组需要采取一系列
当前,世界经济发展的主要趋势,就是经济全球化。特别是进入90年代以后,随着经济全球化进程的加快,我国参与国际大市场的机会越来越多,国内烟草行业面临着非常大的机遇和挑战;