基于生成对抗网络的图像翻译的研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:claverchou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在现如今社会,图像在我们的生活中占据着非常重要的位置,图像处理有着很多的应用领域,这就使得图像处理相关方面的研究变得尤为重要。本文的核心内容是生成对抗网络(GAN),它的出现给很多相关研究都带来了更多发展的机会,而且GAN在处理图像相关的任务时能有很好的表现,本文在此基础上对图像翻译进行研究。生成对抗网络的出现虽然给深度学习带来了更多发展机会,但它同时也存在一些问题,例如收敛困难、训练时间长、训练不稳定等,现存的很多算法模型仍存在一些无法很好解决且待研究的问题,包括训练稳定性、可解释性、泛化性等。本文基于生成对抗网络对图像翻译的内在原理和实际应用中所存在的问题进行了以下的研究:首先本文研究了基于无监督学习的图像翻译框架,为了提升输出结果图像的质量且能够减少训练时间,对Cycle GAN进行了改进。Cycle GAN是基于无监督学习的一种较为通用的算法,它的训练数据不再需要使用到成对数据,但同时也有一定的局限性,在生成图像和训练速度等方面可以进一步改善和提高,模型的训练时间也有待进一步缩减。本论文在Cycle GAN中引入Attention注意力机制,在Cycle GAN基础上改进了模型算法,利用注意力机制,在两个图像域之间建立一定相关性,这样使得模型能更快地学习到关键特征,同时对于生成图像的质量也有了保证,实验结果表明,该方法在学习速度、训练时间、生成图像质量等方面的性能都有了一定提升。其次本文提出一种结合隐空间解耦和条件信息的图像翻译算法,使得模型具有可解释的隐空间解耦能力。这种方法基于隐空间解耦,分离了不同图像域的风格属性信息和内容属性信息,同时加入域条件信息,能只用一个模型就实现多个域之间的图像翻译任务,这大大简化了网络,使得模型更加轻便。实验结果表明,该方法在进行多个图像域的翻译任务时是有效且可行的。
其他文献
磁流体动力学是由瑞典物理学家汉尼斯·阿尔文提出的,它是描述不可磁化的导电流体在电磁场作用下运动的一门学科,广泛应用于天体物理学、受控热核反应、航天工程等多种研究领域。磁流体动力学的基本方程是由流体力学中的纳维-斯托克斯方程和电磁学中的麦克斯韦方程通过洛伦兹力耦合而成的。磁流体动力学方程是非线性偏微分方程组,一般情况下其解析解难以得到,只能数值求解。基于以上背景,在本文中,我们将系统研究磁流体动力学
自从光通信技术中的烽火传信诞生以来,空间光通信便推动着全体人类将所在的社会由之前的工业化社会转向现在的高速信息化社会发展。自由空间光通讯的诞生,带来了具有更安全私密,功耗更低,抗电磁干扰能力更强,传输容量更大,设备体积更小,架设更方便的技术。用于发射和接收载有信息光束的光学天线和用于光束传输的光纤是光学传输系统中十分重要的器件。为了提高传输效率,光学天线的中心遮挡是研究人员一直在不断探索的问题,本
能源是人类社会发展的动力,是实现可持续化发展的关键因素之一,因此各国都在积极研究可控核聚变发电,而激光惯性约束聚变则被视为最可能实现可控核聚变的技术方案。本文针对惯性约束聚变对宽带且高效的三倍频过程的需求,利用理论分析与数值模拟的方式,展开超辐射光的三倍频过程以及通过其他方式补偿超辐射光三倍频过程中的失配量的研究,取得了具有对超辐射光后续实验有指导性意义的结论。主要的研究内容分为以下四个部分。1、
非线性波动方程是一类常用于描述自然现象的数学模型,也是非线性数学物理领域的前沿课题之一,相比单一的理论研究现在更侧重于结合实际应用。通过研究非线性波动方程的解,有助于推动物理学、工程技术等相关学科的发展。本文研究如下两类Rosenau方程Cauchy问题的解:一类经典Rosenau方程和一类具有Stokes阻尼项的六阶非线性波动方程。本文主要内容如下:第一章介绍非线性波动方程的物理背景、研究意义及
随着移动化设备的普及和社交媒体的涌现,汇聚了海量的用户数据,形成了多样的社交网络。如何从多元化信息中提取关键特征,简洁、快速地表达用户影响力,有利于态势感知与舆论导向,有助于区域的综合管理。尽管这方面的研究已经趋于饱和,但现有的建模方法仍然存在以下问题:一是数据缺省与不可信问题,包括数据缺失、信息虚假与隐私保护等;二是信息提取不全面问题,包括研究角度单一、特征复杂冗余以及数据之间存在着相似性与异构
随着现代化建设的加快,变电站有了对设备运行状况进行快速检测的需求,而以前的人工巡视、人工参与仪表的记录与读数已不能满足这迫切的要求;此外,由人工参与方式所带来的缺点还有由于工作人员的工作强度大所导致的不精确读数,人力成本高等;这些都说明了人工参与这种方式已不能完全满足现代化工业生产和发展的需求。从仪表成像的角度上看,在自然环境下所得到的仪表图像可能存在以下问题:图像清晰度低,仪表位置靠近图像边界,
期刊
在自然界中,声波可以通过不同的介质进行传输。针对这一现象,我们需要建立数学模型对其加以描述。在本文中,我们主要研究了跟时谐Helmholtz方程有关的三维声波传输问题。研究偏微分方程的数值方法有许多种,常用的方法有有限元方法、有限差分方法、有限体积方法、边界积分方程方法等等。本文主要运用边界积分方程方法来处理三维声波传输问题。该方法的优点在于我们只需要对边界进行离散。同时,该方法用于数值计算可以进
随着对网络通信技术的日益依赖,仅仅简单的地面网络已经无法满足要求,因此空间信息网络逐渐成为各国的角斗场。空间信息网络是由空间段(卫星等各种航天器)、临近空间段(无人机等各种临近飞行器)和地面段(各种终端及网关)组成的复杂的网络通信系统。由于空间信息网络的节点数量巨大,节点运动具有高动态性,节点之间的连接多样,导致了网络的拓扑结构复杂多变,所以有关空间信息网络拓扑的研究层见叠出,而网络的抗毁性与拓扑
纳米光子学是研究在纳米尺度上光与物质相互作用及其应用的学科,广泛应用于科技医疗等各个领域,其中金属纳米材料因具有独特的等离子体效应,成为学者们关注与研究的重点。由于物理实验耗费较大,同时仅仅依靠纯理论分析无法获得足够的信息,实际研究中一般用数值方法来模拟实际问题。为了研究非局域色散效应的光与金属纳米材料结构相互作用的内在规律,本文针对线性非局部Drude模型,设计了一种解耦的龙格库塔间断伽辽金(R