基于深度学习的运动模糊图像分割

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:shabi12345678
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像分割是计算机视觉领域的一个重要研究方向,在图像理解中扮演着重要角色。图像分割是指将图像的每一个像素分类,从而将图像分割成若干个具有相似性质的区域。在获取图像的过程中,大气、光照等环境因素或者相机抖动、对焦不准的人为因素,都会导致图像质量的退化,使图像变得模糊,传统分割方法不再满足这种退化图像的分割要求。随着深度学习技术的逐步深入,越来越多的研究人员开始使用卷积神经网络来解决计算机视觉领域的问题,涌现出许多优秀的模型。但是一种深度神经网络模型一般只解决一种问题,面对运动模糊图像的分割任务,本文采取串联两种深度神经网络模型的方式,来完成运动模糊图像分割的任务。本文的主要研究工作和创新点如下:首先,提出一种基于生成对抗网络的去运动模糊算法。此算法针对目前运动模糊图像复原过程中模糊核估计复杂、图像复原质量低等问题,将深度学习概念应用于图像复原领域,实现了端到端的去运动模糊算法的模型。在深度学习模型方面,考虑到清晰图像与模糊图像对应像素点比较接近,在模型的损失函数中将内容损失和Wasserstein距离相结合来约束图像内部特征,增强模型的有效性;在网络结构方面,根据残差网络和深度可分离卷积设计了残差可分离卷积模块作为生成网络模块,并加入了双线性插值缓解生成内容的马赛克,在判别模型中加入全局平均池化层来代替全连接层,对整个网络在结构上做正则化以避免过拟合,极大地减少了网络参数,对输入空间变换更具有稳定性;根据实验分析优化,获取了更好的复原率。最后通过实验验证该模型具有显著的复原效果。其次,将去运动模糊算法与最新的语义分割算法Deeplabv3+串联起来解决模糊图像分割问题。在深入研究诸如空洞卷积、空间金字塔池化、多孔空间金字塔池化等关键性技术的基础上,实现了 Deeplabv3+语义分割算法,并验证了复原图像的分割效果。随后利用马尔可夫过程随机生成模糊核的运动轨迹,通过将子像素插值应用于轨迹矢量来生成模糊核,从而人工合成VOC2012数据集对应的模糊数据集。将训练好的去运动模糊算法迁移到人工合成的模糊数据集上,再将新的训练好的去运动模糊算法与DeepLabv3+分割模型串联,对比实验结果验证了该思路的有效性。本文所提算法在Gopro数据集和VOC2012数据集上分别进行了大量的实验,并与现有算法进行对比,实验结果表明了所提算法具有较好的去运动模糊效果以及分割效果。
其他文献
在中国经济发展的新时期,转变发展方式、优化经济结构、转换增长动能等任务尤为艰巨、突出和迫切。基于产业融合的跨界并购是新时期并购重组的重要特征和发展趋势,与传统意义
生物特征识别技术由于其便捷和安全性已经被广泛地应用在当今社会中,而语音作为一种重要的生物特征,蕴含了非常丰富的信息,且由于智能设备的普及,说话人语音的采集成本也非常低廉。因此,对说话人的语音进行分析具有重大的实际应用价值。本文主要讨论了基于深度学习的说话人的声纹识别,并拓展讨论了语音的情绪识别。声纹识别部分又分为说话人辨认和说话人确认两个任务,而语音情绪识别将直接处理为一个多分类的问题。为了利用不
随着人工智能技术的发展,在未来智能时代,人机交互将如同人与人交互一般。要实现这种交互方式,语音识别技术是机器所必须掌握的技能。因此在人工智能的发展历程中,对语音识别
近年来,中国一些优秀的传统剧目在国外大受欢迎,吸引了众多外国艺术家,剧团和普通观众通过各种渠道了解和学习中国戏剧,也由此带来有关戏曲翻译的大量需求。但是,由于中外文化、历史和语言的差异,戏剧翻译还是有很多的困难。中国传统戏剧有其独特的表演体系。行当,唱腔和戏剧道具名称等许多特有的文化词汇都需要尽可能完整地表达。本文旨在通过周贻白《中国戏剧史》第八章的翻译实践,总结出戏曲术语翻译面临的挑战和应对的方
《电影新技术的魅力》(Cinematic Appeals:The Experience Of New Movie Technologies)该书作者以学术研究的视角讲述数字技术在电影制作发展史上发挥的重要作用,通过列举不同风格的影片,以时间发展为线索,讲述新数字技术对好莱坞电影风格及大众审美变化的影响。该书引用影视专业术语较多,语言较难理解,专业跨度大,在翻译过程中困难较多。本翻译实践报告主要分析
本文翻译文本摘自阿里埃勒·罗杰斯(Ariel Rogers)电影和文化系列丛书中的其中一部:《电影新技术的魅力》的第五章。此文本围绕3D电影技术展开讨论和说明,其内容涉及众多3D电影术语,专业性很强,因此,本文的重点及难点就在于这些电影相关术语的翻译。本文将术语分为已规范术语和未规范术语,在翻译这两大类术语的实践中探讨术语翻译策略的选择。在翻译己规范术语时,译者合理使用工具书、专业词典、专业网站;
在“互联网+”的背景下,网络电商平台迅速发展,人们的生活习惯也随之发生了改变,越来越多的人热衷于网上购物并在网络平台上发表意见,以表达对产品属性的情感倾向,从而产生源源不断的商品评论信息。在这些数据中往往包含了大量的用户情感因素,如果能有效地挖掘出用户评论的情感信息,这不仅能为商家提供信息反馈,便于商家及时调整销售决策,还有利于社会调查以便政府做出行之有效的对策。因此研究针对商品评论的文本情感分析
低维半导体材料由于其具有高的结晶质量、显著的尺寸效应以及可控的几何结构等特性而被广泛地应用在光学、电学、光电子学器件当中。尤其是低维半导体异质结构由于其内建电场的作用而进一步提高了诸如存储器、激光器和光探测器等的性能。红外探测器在通信、军事和航空航天等领域发挥着重要的作用。低维材料异质结构是实现红外探测器具有小尺寸、高性能、室温探测等特性的有效途径之一。窄带隙材料PbX(S、Se)具有窄的直接带隙
创新是民族振兴与国家富强的必由之路,培养研究生的创新行为更是建设创新型国家的必要基础。而研究生教育作为高等教育的最顶端,学术创新激情普遍不高,一些激发研究生潜在的
开展党史学习教育,要在深入学习领悟党史的同时,坚定理想信念,牢记初心使命,传承红色基因,赓续共产党人的精神血脉,汲取接续奋斗的强大精神力量,在新时代新征程上展现新担当