基于生成对抗网络的单张图片学习与应用

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:wjran2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的飞速发展,基于深度学习尤其是生成对抗网络的图像研究日益火热,在图像超分辨率、图像编辑等诸多应用领域都取得了较好的应用效果。然而,当下基于深度学习模型的方法通常是采用大数据集的训练学习方式,通过足够多的样本学习实现模型的性能优化,然后基于训练好的模型进行泛化应用。本文希望构建一个关于单张图像的学习应用模型,在训练过程中能够避免大数据集的训练要求,同时完成单张图像的特征学习和相关应用。SinGAN网络是近些年来提出的一个新兴的基于单张图像的生成学习模型,能够较好的完成图像特征学习与应用的目标。但是该网络模型的结构较为精简,在实际使用时会面临两个挑战:(1)仅采用卷积模块对于图像特征处理,无法根据需求增强对图像中重要特征信息的表达,模型的特征表达能力不足。(2)模型的输入图像随机多变,难以规律性捕获输入图像的内容信息与结构特征。针对这两个问题,本文提出如下解决方法:(1)在判别器模型中加入了注意力机制,从通道维度和空间维度两个方向增强模型对于输入图像中重要特征信息的关注与表达,从而增强判别器模型的识别能力。由于生成对抗网络采用对抗训练的方式,在提升判别器性能的同时,使得生成器更难“欺骗”判别器,有助于生成器更好的学习真实图像的特征,增强生成器的生成性能。(2)在图像生成过程中不再只采用常规卷积核提取图像特征,在生成器模型中引入了可变形卷积模块,在图像学习过程中可以调整模型的卷积视野和特征提取范围,有利于模型捕获图像的复杂结构和内容信息,提高图像的生成质量。通过实验验证,本文提出的模型能够较好的重建出高质量的图像样本,并且基于训练学得的模型,在图像风格变换与图像和谐化应用方面,取得了较好的应用效果。
其他文献
21世纪以来,人类的科技水平逐渐提高,这些最新产生的技术能够大幅降低人们的工作劳动强度,降低人工成本。但是如今仍有很多高成本的人工服务,例如牙齿诊断与治疗。随着社会科技不断的发展,越来越多的新技术逐渐涌现,诸如人工智能等技术自2012年得到长足的发展,相比于传统基于人工的方法,人工智能可以以较快的速度,较低的成本实现很多过去需要人类亲自行动的高成本工作,诸如自动或半自动的医疗诊断、自动驾驶、智能安
学位
数字图像被广泛传递于各类网络平台,与此同时由其带来隐私泄露和数据窃取的现象也频繁出现,时刻威胁着信息内容的安全。网络环境下的图像信息隐藏因此成为信息隐藏领域的研究热点,但目前流行方法在安全性和鲁棒性等方面仍有待提高。为实现网络环境下的隐私保护和隐蔽通信,本文深入研究面向云存储的安全密文域可逆信息隐藏方法和面向社交网络的实用鲁棒隐写方法;在不可信的云网络环境下,通过结合可逆信息隐藏和图像加密来达到载
学位
理性智能体旨在最大化个人利益从而逐渐放弃与他人合作,更倾向于享受他人付出所带来的利益,最终导致系统崩溃。在网络空间安全治理、供应链自主可控等智能自治场景中,利益相关智能体构成了复杂的网络化系统。以往社会合作问题采用反映社会关系的成对网络来建模,但这无法反映智能体间的合作关系。因此,如何对合作事件真实建模并使系统合作规范涌现成为网络社会治理中重要的研究课题。Axelrod元规范博弈通过引入二阶惩罚机
学位
智能合约的安全是保证目前区块链系统安全的必要条件。目前常见的智能合约代码分析方法可分为四类:静态分析方法,动态分析方法,机器学习分析方法和深度学习分析方法。而这些方法当前都存在着一些缺点。静态分析方法的准确率较低,误报率较高。动态分析方法需要去执行代码,要求较高,流程比较复杂,消耗的时间较多。机器学习和深度学习目前都需要自己手动去发掘并设置特征属性。而且目前的分析模型都没有考虑隐私保护的问题,都是
学位
近年来,得益于计算机硬件和深度学习的不断发展,以深度伪造(Deepfake)为代表的人脸操纵视频在抖音和You Tube等视频分享网站大肆传播。大量欺骗性极强的换脸视频对个人隐私、社会稳定和国家安全构成巨大的潜在威胁,如何验证视频或者图像的真实性逐渐成为数字社会最重要的话题之一。鉴于现有基于深度学习的检测方法可解释性不足,检测模型在面对压缩攻击时鲁棒性不强等问题,本文从提高可解释性和鲁棒性两个方向
学位
报纸
<正>近日,云南西双版纳州纪委州监委通报,部分群众反映景洪市健康证“办证难”问题长期未得到有效解决,对市人民政府、市卫生健康局党组,以及市长、副市长等多个相关单位及其负责人进行了问责处理。健康证作为餐饮、住宿、文化娱乐等服务行业从业人员的身体健康证明,是保护从业人员和服务对象健康的重要预防性措施。也是这些服务行业从业人员的入行条件之一。自健康证取消收费体检后,一些地方“办证难”却成了较为普遍的现象
期刊
实际的控制系统或者工程设备存在其自身的物理限制或者人为约束,使得控制系统的控制输入是有限的。由于输入饱和具有非光滑的特性,很难对输入饱和函数进行线性化处理,这使得对于存在输入饱和的系统的分析与设计都变得更加困难。切换系统是由有限数量的子系统和一个控制子系统之间切换的规则组成的混杂系统。在实际的控制系统中,很多领域的控制系统都通过建立切换系统模型来提高系统性能,如化工过程控制、计算机控制等。由于切换
学位
在深度着色技术的帮助下,人们能够轻易对图像和视频进行效果逼真的重着色操作,生成视觉层面上难分真假的色彩信息。该技术虽然带来拟真与便利,但也引致图像与视频色彩真假难鉴别问题。研究图像、视频色彩真实性鉴别技术对于多媒体数字取证领域的发展与完善具有重要意义和实用价值。然而,目前相关研究仍存在训练样本多、特征维度高、鲁棒性能低等方面的局限。因此,本文以图像与视频为研究实例,二者的重着色篡改取证技术为主要研
学位
随着互联网的普及和发展,越来越多的人享受着第三方应用服务带来的便利。我们知道享受这些应用的第一步是完成身份鉴别。在各种认证方式中,生物特征提供了很好的用户友好性。然而由于生物特征的不可再生性,即表示一旦用户的某个生物特征被泄露或窃取,那么该生物特征就难以再次使用了,这为生物特征的安全保存提出了很高的要求。模糊提取器的出现很好地解决了这一问题。模糊提取器可以从各种噪声随机源(例如生物特征,物理不可克
学位