生成模型理论与应用研究

来源 :电子科技大学 | 被引量 : 1次 | 上传用户:hangarfield
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
著名物理学家理查德·费曼说过,“凡我不能创造的,我就不能理解”。如果让人工智能学会创造或是生成真实的图像,那么这将促进人工智能认识真实的世界。然而,如何让人工智能学会创造或生成以假乱真的图像,面临极大的挑战。为了应对该挑战,生成模型因其能够有效地学习真实分布逐渐在众多人工智能算法中脱颖而出,备受研究者关注。在图像生成、文本生成、视频生成等许多应用领域中,生成模型取得了丰硕的成果。本文针对生成模型理论及其在图像生成中的几个关键问题进行了研究,包括提高判别器的识别能力和稳定生成对抗网络的训练过程以获得更好的噪声生成图像,引导生成对抗网络学习更多的信息以获得更好的图像迁移效果,避免判别器过早陷入局部次优状态以获得更好的文本生成图像。相应的展开了五个相关的研究工作,具体如下:(1)针对噪声生成图像任务中判别器识别能力有限以及模型训练不稳定的问题,本文提出了基于样本增强和条件约束的图像生成方法。首先,在训练过程中,为了提高判别器的判别能力,本文设计了融合真样本和假样本训练的混合增强判别器。其次,为了减小引起生成器损失函数值突变噪声所带来的不稳定对训练过程的影响,本文对生成器施加一个病态条件数惩罚。最后,本文将所提出的方法应用于三种不同的损失函数,验证了混合增强判别器和惩罚的泛化性。实验结果表明,该方法通过混合样本和病态条件数惩罚分别提高了判别器的判别能力和稳定了训练的过程,获得了较好的生成图像。(2)针对噪声生成图像任务中由于生成器对输入噪声不够鲁棒以及判别器在训练中判别能力逐渐下降,导致生成图像质量不佳的问题,本文提出了基于降噪自编码约束的图像生成方法。首先,为了提高生成器对输入噪声的鲁棒性,本文提出了一种新的生成器约束,该约束由扰动噪声生成的图像编码与输入噪声差异的F范数组成。然后,为了防止判别器在训练过程中判别能力逐渐下降,本文设计了一种新的样本增强判别器,该样本增强判别器融合了输入噪声及其对应扰动噪声生成的图像与真实图像来完成训练。最后,本文将降噪惩罚和样本增强判别器应用于五个不同的模型中,验证了所提方法的可扩展性。实验结果表明,该方法通过降噪惩罚和样本增强判别器提高了对比模型生成图像的质量。(3)针对噪声生成图像任务中在训练生成对抗网络的过程中有些输入噪声和生成的样本会使生成器和判别器的训练不稳定,影响生成图像质量的问题,本文提出了基于辅助网络调控的图像生成方法。首先,为了分别减小生成器和判别器在训练过程中的不稳定性,本文引入辅助噪声作为输入,并设计了一个可学习的辅助模块。其次,为了让可学习的辅助模块连同生成对抗网络一起训练,本文巧妙地设计了一种可学习的辅助惩罚和一种可学习的辅助判别器,分别用于约束生成器和提高判别器的稳定性。然后将所提方法应用于Hinge和LSGANs损失函数,验证了它的可扩展性。实验结果表明,该方法能够提高GANs训练的稳定性以及在不同程度上提高了对比模型的性能。(4)针对图像迁移任务中因缺少引导生成的辅助信息,造成生成图像细节内容丢失的问题,本文提出了增加辅助域的多约束图像迁移方法。首先,为了引导生成器学习更多的目标域图像的细节内容,本文增加了一个相似的辅助域来引导生成器。然后,为了克服模型映射空间过大的问题,本文设计了一种包含三个域的循环一致性损失函数。最后,为了使所提模型训练更加稳定,本文设计了一种多尺度、多层次的判别器。实验结果表明,该方法通过增加相似辅助域和使用多种约束丰富了生成图像的细节内容,提高了生成图像的质量。(5)针对文本生成图像任务中因判别器容易过早陷入局部次优状态,导致文本生成图像效果不佳的问题,本文提出了面向文本到图像的生成方法。首先,为了防止判别器过早陷入局部次优状态,本文设计了一种新颖的混合损失增强判别器。其次,为了减小该判别器分类识别的敏感性,让它关注语义和结构的变化,本文将假样本(真样本)的损失值加入到真样本(假样本)的损失值中去训练它。在采用Adam优化的过程中,混合了真假样本的损失值增强了信号的传递,进而扰动了判别器参数的更新,阻止判别器过早陷入局部次优状态。然后,本文将混合损失增强判别器应用到两类文本生成图像的任务中,验证了混合损失增强判别器的可扩展性。实验结果表明,该方法能够避免判别器过早陷入局部次优,提高了现存模型生成图像的性能。综上所述,本文围绕生成模型理论及其在图像生成中的应用展开相关的研究工作,提出了五个不同的方法,并将它们成功地应用于噪声生成图像、图像迁移以及文本生成图像任务中,具有一定的理论价值和应用价值。
其他文献
本文对近50年来中国旧石器考古学的主要成果作了简要的记述。依若干早更新世人类化石和旧石器文化地点发现的先后, 论述了人类在中国境内的历史悠久性, 随着不断的新发现而加深对
城市轨道交通由于系统复杂且牵涉面广,无论是建设期还是运营期都面临着安全风险,成为社会普遍关注的焦点。如何保障城市轨道交通安全,已成为政府主管部门和城市轨道交通各相
建立一般弹性扣件、粘结板式弹性扣件和轨道减振器扣件下的轨道模型,用有限元法模拟分析列车移动荷载作用下,不同扣件刚度、不同行车速度时钢轨的振动和荷载的传递情况。计算
针对水电工程EPC项目设计管理存在的问题,基于总承包商角度探讨了EPC项目设计质量管理,建立了EPC项目设计管理集成模式,并构建了有效设计管理体系,为完善EPC项目总承包商设计
作为口耳相传的文学样式,保定民间歌谣原汁原味地记录了保定这片古老土地上人们淳厚的民风民俗。其独特的传统节日习俗在质朴的民间歌谣中得以完整的保留,为我们了解保定地域
本文以余斌教授所叙写的抗战时期的昆明文化类作品为例,深入挖掘其作品所蕴藉的内涵和为文之道,就此延伸探讨在当代社会,我们在文化类作品叙写中如何体悟“文章为何”“文章
"写意"作为中国画的本体语言,作为文化观念,作为审美活动,其精神是恒定的;而诉诸于物化,其形态又是演进的。如何以新的形态来拓展和加深"写意"的内涵,是新世纪赋予我们的任务
综述近年有机稀土在PVC塑料建材中应用;分析了稀土热稳定剂对PVC的稳定机理;介绍了稀土稳定剂的种类以及稀土热稳定剂;论述了多功能复合型稀土热稳定剂的特点和应用以及发展
随着计算机多媒体技术在电力系统培训中的应用,电力系统培训方式趋于数字化和多样化。以电力系统带电作业培训为例,将Quest3D作为重要设计工具引入电力系统仿真培训中,采用Qu
本文将介绍V80-2.0MW风力发电机偏航系统的基本结构,基本功能及风力发电机偏航系统的工作原理,针对V80-2.0MW风力发电机偏航系统经常出现的故障提出了相应的解决措施。