基于GAN实现结构重建和纹理合成的图像修复方法研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:wonder568
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,由于计算机技术的蓬勃发展,数字图像处理技术引起各界专家学者更多的关心和注意。数字图像处理技术,在人们的日常生活中及其各个工作行业之中充当着不可或缺的角色。而随着海量数字图像的产生、储存和传输,图像在一定阶段受到外部因素的干扰无法避免,导致一些图像信息的缺失,由此产生了图像修复技术。图像修复,即指利用图像中未破损区域的信息,通过指定的修复规则,比如图像已知区域和破损区域的几何结构或统计特征存在一定的相似性等,来补全图像的破损区域,使破损图像经过修复看起来真实生动。目前,大多数现有的图像修复方法在重建图像结构时并不能令人满意,尤其是在图像重要部分缺失的情况下。有些方法着重在缺失区域和未受损区域之间重建连续、合理的结构,但在恢复图像纹理时,会产生与周围区域不一致的模糊纹理。为了使修复后的图像具有连续的结构和生动的纹理,本文提出了一种使用边缘预测和外观流的图像修复方法。本文的图像修复方法主要包括三个阶段:第一阶段是边缘生成器,首先使用RTV方法生成平滑图像,平滑图像可以代表原始图像的全局结构,然后通过Canny边缘检测器得到平滑图像的边缘图,边缘生成器通过预测代表全局结构的平滑图像缺失区域的边缘数据来逼近结构信息,从而得到图像的边缘结构;第二阶段是平滑结构重构器,将边缘图与破损的平滑结构图像叠加作为输入,通过结构生成器预测破损区域的平滑结构以恢复平滑图像的全局结构;第三阶段是纹理生成器,将破损图像及上阶段生成的平滑结构图像作为输入,经过编码得到对应的特征图,采用外观流生成表示图像各区域之间相关性的矩阵,即外观流场,外观流场用于将像素从源区域流动到目标区域,以生成生动的纹理;然后通过高斯采样将未破损区域的特征转移到破损区域,经过解码得到最后修复的图像,经实验验证具有外观流操作的纹理生成器可以在获得重建的结构图像后生成生动的纹理。本文方法选择Places2和Celeb A两个数据集进行实验。与现有方法相比,本文方法修复的图像结构更合理,纹理更生动,性能更好。
其他文献
自从人们进入信息化时代以来,互联网一直在潜移默化地影响着人们的日常生活。电子产品在日常生活中随处可见,微博、淘宝等网络平台为人们获取外界信息提供了便利,同时也产生了大量对时事以及产品的评论文本。文本情感分析是挖掘评论文本表达的情感信息,挖掘其中蕴含的情感信息可以为消费者提供决策支持,有助于商家及时获取反馈信息并对产品进行完善升级,同时有助于政府正确引导舆情风向。因此文本情感分析具有巨大的实用价值。
学位
受互联网技术的覆盖以及移动端设备激增的影响,人工智能逐渐渗透到人们商业生活的方方面面。对话系统作为人工智能领域下的重要产物,得益于数据的支持以及深度学习技术的进步,也逐渐向更人性化方面发展。对话系统从特定领域下的任务型逐渐发展到开放领域下的聊天型,从固定规则下的检索型发展为Seq2Seq框架下对话生成型。综合国内外研究现状,基于生成的对话系统能够脱离规则的束缚生成数据库中没有但合理的回答,且模型的
学位
近年来,机械臂的研究一直是国际、国内极其重视的研究热点,在国家政策的大力支持下,目前,由于我国机械臂及智能系统技术正得到飞速发展,工业机械臂、医疗机械臂的应用得到了进一步推广,这极大的促进了我国工业、国防科技事业的大力发展。在机械臂运动过程中,因为各关节和连杆之间的作用力,产生的柔性效应会导致在执行实际任务时精度降低,所以机械臂的柔性特征是需要解决的首要问题。柔性机械臂是一个具有时变、强耦合等特性
学位
当今社会随着互联网的不断发展,学习资源的数量呈指数型上升,种类也多种多样,例如数字图书馆的学习资源、网络课程学习资源等等。在如此多的学习资源面前,用户想要找到最适合自己的学习资源也变得越来越困难,所以如何准确的向用户推荐最适合他的学习资源是一个非常必要的问题。推荐系统是根据用户的需求、兴趣将用户感兴趣的信息(如产品、图书、课程等)推荐给用户的系统。传统的推荐方法在推荐的过程中有很多局限:推荐过程是
学位
情绪的好坏决定着人们的生活状态,快乐、满足和喜悦等积极情绪能够提升幸福感,相反,焦虑、忧愁和厌恶等消极情绪会使人患上精神疾病甚至威胁生命。如何提高情绪分类的准确率并提高在日常生活场景应用的普适性越来越受到研究者的关注。传统的基于生理信号的情绪分类主要通过特征提取和训练分类器进行分类,传统方法的不足之处是准确率低并且可解释性差。Shapelet是时间序列的子序列,它能够出现在时间序列的任何位置,并且
学位
长链非编码RNA(long noncoding RNAs,lnc RNAs)被定义为长度大于200个核苷酸的非编码RNA。lnc RNAs在早期一直被人们认为是转录噪声,直到最近的研究证明lnc RNAs具有丰富的生物功能,几乎参与所有的生命过程。lnc RNAs的突变和失调与许多疾病相关,在生物体内发挥着重要作用。因此,识别新的与疾病相关的lnc RNAs有助于人类理解lnc RNAs的功能、识
学位
身份认证是一种用于确认用户身份的安全保障技术,在日常生活中一般可通过检查对方证件等身份证明物品的方式来实现。近年来,钥匙、证件等传统身份认证方式由于存在易丢失、携带不便等缺点,在一些应用场景中已渐渐被基于生物特征识别的身份认证方式所取代。然而,目前的部分生物特征存在易被伪造或难以与其他生物特征融合等问题。眼动作为一种行为性生物特征能够反映大脑区域和眼部肌肉的活动,不容易被伪造,因而具有较高的安全性
学位
如今,在网络访问中最方便的认证方式仍然是使用口令。纯数字口令更是ATM卡、信用卡、在线支付等认证的主要形式。目前关于口令安全的研究主要关注组合口令,比如同时包括字母、数字和特殊字符的口令。相对而言,对于纯数字口令和金融口令安全性的研究很少。为了弥补这一不足,本文研究了从泄露的国内网站数据集中提取的数字口令的安全性。主要贡献如下:(1)基于RNN的数字口令的安全性分析。首先,使用皮尔逊卡方检验验证了
学位
进化多目标优化算法(evolutionary multi-objective optimization algorithm,简称EMOA)研究利用进化计算的方法去求解多目标优化问题(multi-objective optimization problems,简称MOPs),其已经成为当下进化计算领域的一个热点。在EMOA中,基于分解的多目标进化算法(multi-objective evolutio
学位
近年来,随着生物医学技术和计算机技术的飞速发展,产生了海量的生物医学文本数据,如何有效处理和充分利用这些数据已经成为一个重要问题。生物医学命名实体识别是生物医学文本信息处理的一项重要任务,并对其下游任务如实体关系抽取、问答系统、文档分类等产生重要影响。生物医学命名实体识别旨在识别生物医学文本中的疾病、基因、化学物质等具有生物医学意义的实体并标记其类型。与通用领域的命名实体识别任务相比,在生物医学领
学位