基于生成对抗网络的语义图像合成编辑算法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:PDH
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会物质资源的不断丰富,人们对于人文艺术的追求也不断提升。传统的艺术创作对创作者的专业素质要求比较高,也需要耗费较多的时间人力成本。而近期随着人工智能技术的发展,特别是深度学习的巨大成功,如何将其与人文艺术相结合也成为了工业界与学术界的热点话题。利用计算机系统自动生成符合用户期望的图像内容,不仅减少了艺术创作的门槛,同时也在电商、文娱、内容安全等领域有着广泛而重要的实用价值。本文主要研究基于语义布局的图像合成与编辑技术,即依据特定的语义空间布局自动生成真实图像。随着变分自编码器、生成对抗网络等生成模型的提出,基于深度神经网络技术的图像模型被应用于语义图像的合成与编辑中,并且取得了巨大的成功。相比于传统基于检索与组合的策略,这些算法不仅可以生成出训练数据之外的新语义图像,同时可以确保生成的图像具有更好的语义一致性与可控性。然而,以真正实现非常逼真且具有可控性的图像生成编辑操作为目标,针对从条件输入、到生成器模型、再到合成图像的整个过程,现有算法依然存在着以下几点挑战:对于输入条件,现有算法对于同一语义目标都只利用单一或者通用的条件表征形式进行控制,而真实场景中目标往往具有多个属性,且不同语义目标具有各自特有的属性形式,这对目标属性解耦与多条件表征提出了要求;对于生成器网络的设计,目前的算法大都采用了大模型和复杂模块设计的思路来提升生成图像的质量而忽略了生成器网络的模型大小和计算复杂度,而在实际应用中,巨大的存储计算开销会限制深度生成模型的应用;对于图像合成结果的可控性,目前的算法仅仅停留在语义级别,无法针对单个实例对象进行多模态的合成与编辑,而实际应用中,用户往往需要针对同一语义类别的不同实例进行差异化的合成与编辑。本文针对这些关键问题进行了研究,主要的研究工作及创新点如下:1.提出一个基于多条件联合控制的人像发型编辑算法为了能够更好地控制发型的编辑,该算法首先将图像特征解耦为四个部分:外观、形状、结构与背景。其中结构特征采用基于密集方向场的形式来表征发丝在每一处的方向。基于这四个不同表现形式的特征,该算法分别设计了对应的网络模块进行处理并在主干生成器中将其进行融合以合成出最终的图像。实验结果表明,通过这种特征解耦与融合的方式可以有效地对人像发型的外观、形状、轮廓进行编辑。此外,基于该算法的交互系统支持用户通过选择参考图像与绘制的方式来控制发型的形状与结构。2.提出一个基于语义自适应调制的语义图像合成算法该算法分析了目前语义图像合成领域常用的空间自适应解调制(SPatially-Adaptive DEnormalization,SPADE)模型,发现其通过浅层调制网络实现的空间自适应调制模块需要额外较大的模型参数存储开销与计算开销,同时由于语义掩模的特性在高分辨率时无法利用浅层卷积真正实现空间自适应调制。基于此分析,该算法提出了语义自适应调制方法,其可以在不影响生成图像质量的同时提升模型的效率。在位置编码的帮助下,该算法还可以进一步支持空间自适应调制。实验表明,该算法所提出的模块能够代替SPADE应用到其他算法框架中,在不影响其功能性的同时进一步提升了效率。3.提出一个基于语义概率建模的实例多模态图像合成算法为了能够在实例级别控制合成对象的多模态生成,该算法首先为每一个语义类别建立了对应的概率分布,然后依据每个实例在其对应的语义概率分布中进行采样,建立实例自适应特征,并以此来进行特征的调制。利用这种实例自适应调制模块,该算法设计了基于统一采样的生成器网络以避免多次采样带来的相互干扰。为了减少训练过程中的歧义,该算法设计了一个先验噪声重映射模块并且降低了感知损失与判别器特征匹配损失在浅层的权重。此外,为了能够提升诸如街道、室内等复杂场景的图像合成能力,该算法探索了不同生成器结构所带来的影响。不同于目前大部分算法所采用的简单堆砌,该算法从两种角度设计了生成器网络,包括步进生成模块与多尺度优化模块。该算法还尝试将草图作为额外的条件输入来进一步提升网络对语义对象内部结构的控制。实验结果表明,该算法能够实现实例级别的多模态控制,同时还能够利用先验噪声映射模块支持从参考图像实例进行对象外观风格的迁移。
其他文献
当前我国经济社会进一步发展,工程建设如火如荼,但是城市土地资源十分紧张,为了促进资金节约型、环境友好型社会的建设,绿色建筑如雨后春笋般涌现,也成为了当前最主要的形式之一。和普通居民楼相比,高层建筑的建设规模更大、材料使用更多、技术要求也更高,剪力墙结构的优化就是重点施工内容之一。基于此,本文对绿色建筑高层剪力墙结构优化设计展开了分析,并提出了相应的对策。
在当前初中阶段,学困生依然普遍存在,此类学生的学习兴趣和品德修养与普通学生有一定的差异。因此,要实现均衡教育,必须重视学困生转化工作,加强学困生德育教育,规范学困生学习态度,提高学困生学习成绩,提高学困生的道德修养,促进学困生的教育质量。鉴于此,笔者着重分析了初中学困生德育教育的具体路径。
责任伦理作为应用伦理学的一个分支,在当前乱象丛生的图书出版领域中有着极大的应用空间。甄巍然的《中国图书出版责任伦理研究》以出版业层出不穷的讹误、跟风、虚假、低俗等出版乱象为中心,批判了把关人缺席、职业精神淡薄,以及出版人责任伦理困境认知与责任价值失衡等典型的出版业症候。同时,她还通过布尔迪厄的场域理论,探究了出版责任伦理的影响因素;反思了中国图书出版行业可持续发展的科学路径;强调了出版主体为了承担
基层容错机制是新时期推进干部队伍管理的增益内容,有助于激发基层治理转型进程中干部创新和担当之举,实践中面临着低效运转的困境。引入决策过程的分析框架,整合性分析出基层容错机制低效运转的致因机理:在决策酝酿上,良善初衷与约束环境难适应;在决策制定上,文本建构与现实对接显矛盾;在决策实施上,观念能力与有效运作不匹配;在决策反馈上,检查修复与辐射扩散相脱钩。为推进基层容错机制运转充分发挥出实效性和激励性,
目的:探讨mi R-877-5p靶向CDKN1B在LPS诱导的HPMECs及CLP诱导的ARDS小鼠模型中的作用及其作用机制。方法:1.建立LPS诱导的HPMECs,转染mi R-877-5p mimic NC、mi R-877-5p mimic、mi R-877-5p inhibitor NC、mi R-877-5p inhibitor;感染Lv-NC、Lv-CDKN1B后,使用q RT-PCR
饲料机械设备是畜牧业的基石,也是保证畜牧业快速发展的重要保障。只有饲料机械正常运行,才可以保证牲畜有足够饲料,从而茁壮成长,为社会提供充足的优质肉产品。但是随着饲料机械设备的不断运行,设备的损耗不断加剧,导致设备急需润滑以及养护。针对这一情况,文章探讨了饲料机械设备的润滑管理技术与方法,为饲料机械设备的润滑以及养护提出建议,以期促进我国畜牧业的快速发展。
剪力墙结构在高层建筑中占据着非常重要的位置,是保障总体建筑可靠性、安全性的关键要素。而在进行高层建筑剪力墙结构设计工作时,必须要保障高层建筑质量得到有效提升。在此基础上,本文站在绿色建筑的角度,同时结合实际案例,详细分析以及讨论了高层剪力墙结构优化设计,以供参考。
食品机械润滑油的润滑性能直接影响机械的磨损程度,进而影响机械的使用寿命。而机械齿轮上的铁元素又是磨损过程中容易剥落的,测定模拟使用后的润滑油中铁元素的磨损量,比较其润滑品质。通过采用分光光度法研究铁含量的最佳试验条件:最大吸收波长为512 nm,10%盐酸羟胺溶液2.50 m L,HAc-Na Ac缓冲溶液(pH 4.7),0.15%邻菲罗啉溶液4.00 m L,显色时间20 min。线性范围为0
<正>针对“素质教育”和新课改的要求,在课堂教学中提出驱动性问题教学是非常有必要的。驱动性问题教学又称PBL,是一种新型的教学模式,能调动学生的积极性,帮助学生将知识与真实生活联系起来。在平时的PBL活动展示中,我们看到的更多是出项课。学生展示自己的项目成果,分享自己的探究历程,呈现自己对问题的理解。不过很多时候,我们更关心这个问题是如何被提出和分析的,而让学生对解决这个问题充满期待就需要我们关注
期刊
通过对立德树人的职责和时代内涵的梳理,从思想认识、教学能力、教学手段3个方面分析了现阶段飞行签派员业务技能培训中课程思政方面的不足之处,由“立德”与“树人”的逻辑关系总结课程思政在飞行签派员培训中的积极作用,最后,从健全政策制度、坚持三观导向、发挥教员团队优势、增强德育能力和转变教育观念5个方面提出了提升飞行签派教员立德树人教学能力的途径和方法。