基于深度学习的图像超分辨率重建算法研究

来源 :深圳大学 | 被引量 : 0次 | 上传用户:cecil666666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化和数字化的快速发展,人们对信息传播质量的要求日益提高,作为传播最为广泛的媒体之一,数字图像的成像质量也成为了各行各业关注的焦点。然而,成像硬件、成像环境以及传输技术等条件的限制往往会降低图像的分辨率,导致图像信息的丢失。因此,如何将低分辨率图像通过算法重建为高分辨率图像始终是图像处理以及计算机视觉领域的一个热门研究方向。近几年利用深度学习算法进行图像超分辨率重建的研究逐渐增多,同时也取得了一些成果。本文开展了基于深度学习的图像超分辨率重建算法研究,主要研究内容包括:(1)提出了基于感受野融合和通道信息融合的图像超分辨率重建算法RCFSR,Receptive Field and Channel Information Fusion Super-Resolution Network)。利用多尺度卷积层代替一般超分重建网络中的单尺度卷积层,构建感受野融合单元,提高网络对输入图像中信息分布密度差异的适应性,提升网络的鲁棒性以及对感受野的自适应能力;利用压缩激励机制构建通道信息融合单元,充分利用图像通道信息,提高网络重建准确率,缓解空间特征提取的压力,提升网络重建效率;利用残差学习的方法,构建感受野与通道信息融合块(RCFB,Receptive Field and Channel Information Fusion Block)以及感受野与通道信息融合组(RCFG,Receptive Field and Channel Information Fusion Group),在加深网络深度的同时缓解梯度消失问题,并通过实验确定网络深度;利用缩放卷积代替反卷积对图像进行上采样处理,解决了现有超分网络中反卷积法带来的棋盘效应问题,提高成像清晰度,降低图像颗粒感。(2)提出了基于自标准化指数型线性单元(SELU,Self-Normalizing Exponential Linear Unit)以及权重标准化(WN,Weight Normalizing)策略的图像超分辨率重建算法。利用SELU代替一般超分网络中的修正线性单元(Re LU,Rectified Linear Unit),解决Re LU函数负半轴置“0”带来的神经元失活问题,同时为函数添加饱和区缓解梯度消失以及数值爆炸等问题;利用WN策略代替一般超分网络中的批量标准化(BN,Batch Normalization)策略,配合SELU函数控制网络计算带来的数据分布变化,解决了数据分布偏移(Internal Covariate Shift)问题,使网络训练更加稳定,同时加快网络收敛速度。(3)针对已提出的模型算法进行轻量化处理。深度学习优越的性能很大程度是依赖于深度网络庞大的参数量,但是同时也带来计算资源需求大、计算时间长、模型内存占用过多等问题。为了解决上述问题,对网络进行小卷积核叠加替换大卷积核的轻量化处理,在保留相同感受野以及不影响网络重建质量的同时,降低网络参数量,提高网络计算效率,提升算法的可移植性以及实时处理能力。
其他文献
在现实生活中,人们常常需要对自己拍摄的照片进行各种操作,以实现期望的视觉效果。例如给照片中的人物化妆,改变图像中的呈现的时间或季节,按照某种特定艺术风格对图像进行渲染等等。这通常需要借助相应的图像编辑工具,例如Photo Shop等,并花费大量的时间和精力才能实现上述效果。图像风格转换技术可自动地实现上述图像编辑任务,降低图像编辑的操作难度,提升易用性。给定一张内容图像作为输入和一张图像作为风格参
深度学习是机器学习领域中的一个研究方向,是一种以复杂神经网络为基础架构,学习数据的内在规律和表示特征的算法。深度学习使计算机具有像人一样的分析学习能力——能够识别文字图像声音和挖掘数据内部特征,因此,深度学习已被广泛应用于搜索技术,数据挖掘,自然语言处理,图像识别,机器人导航,推荐系统和个性化技术中,同时也在其他相关领域中取得了许多成果。然而,现有的深度学习模型在计算上昂贵且占用大量内存,从而阻碍
近年来,随着现代信息技术的飞速发展,人类进入信息社会,越来越多现实应用领域涉及到多标签学习问题,如文本分类、生物信息学、图像识别等等。传统的单标签学习中,学习对象只隶属于单一类别,而多标签学习中,学习对象可同时隶属于多个类别,并且类别(标签)之间存在着复杂的关联性。多标签学习的目的是准确预测未知样本具有的标签子集,由于标签数量可能巨大且互相之间存在着复杂的关联性,因此,比传统的单标签学习具有更高的
随着计算机科学的发展,数字图像和视频成为人类获取外界信息的主要来源,而在现实世界的夜晚或者其他低光条件下,我们获得的图像和视频质量会降低,这包括亮度低、对比度低、噪声大等特点.这些图像和视频质量的降低将会直接影响到监控安防、夜间行车和生物医学等领域的发展.因此,随着计算机视觉等研究领域的不断深入,图像处理技术备受重视,其中低光图像增强就是计算机视觉的一项重要课题.对于一些经典的低光图像增强算法,参
数字图像处理近年来得到了极大的重视和长足的发展,并在科学研究、医疗卫生、通信方面得到了广泛的应用.在实际图像形成、传输的过程中,由于各种干扰因素的存在图片会受到噪声的污染.这严重影响了人们对数字图像的认识,所以图像复原在图像处理中十分重要.本文主要针对脉冲噪声(特别是椒盐噪声和随机值脉冲噪声),提出基于鲁棒分形图像编码的原始对偶算法和低秩加权核范数算法,数值实验也说明了这两种算法的有效性.具体研究
大数据时代,聚类分析是探索性数据分析不可或缺的工具.与分类相异,聚类是在无监督环境下进行的.在聚类分析中,人们通常认为彼此接近的点往往属于同一个类别,这就是所谓的聚类假设.通常情况下,同一类中的模式比不同类中的模式相似性更大.当我们把研究对象数字化为多维空间当中的点时,模式之间的相似性可转化为对应数据点之间的邻近度(或相似系数).根据聚类的这些特点,本学位论文提出了一种基于类内邻近度的聚类算法框架
在真实场景中,由于被拍摄物体快速运动、拍摄者手抖等各种原因,使得运动模糊成为最常见的模糊类型之一,运动模糊图像复原技术成为了一大研究热点。近几年,随着计算机处理速度和存储能力的提升,在运动模糊图像复原这一任务中,利用深度学习对模糊图像进行复原的方法发展迅速,该类方法使用卷积神经网络自动估计模糊核,显著提高了复原效果。主流的运动模糊图像复原算法均需要使用成对的数据集进行训练,而获取成对的数据集往往比
图像分割是按照不同特征将图像划分成互不重叠、具有独特性质的各个区域,从而提取感兴趣目标的位置或者边界的过程.这一技术是进一步图像分析、理解的基础和关键,被广泛应用于多个领域,特别是在图像处理领域占据着重要的地位.迄今为止,上千种分割方法已被提出,通常都是针对特定问题的图像分割方法,具有一定的针对性和局限性,无法形成一个适合所有类型图像通用的分割算法.基于变分水平集方法和基于区域的活动轮廓分割方法在
背景:人工全膝关节置换术(Total knee arthroplasty,TKA)中在使用旋转平台假体(Rotating-platform prosthesis,RP)时,对后交叉韧带的不同处理方式中有两种假体设计分别对应两种手术方式,其中一种是后交叉韧带保留型旋转平台假体(Posterior cruciate-retaining rotating-platform prosthesis,CR-R
量子计算是依赖于量子力学原理来获得解的一种新型计算模型,由于量子计算的并行计算能力,量子计算在解决某些特定问题时,它比经典计算的效率要高。Grover量子搜索算法是量子算法中具有广泛应用前景的一种算法,算法可以在量子线路复杂度为/O(2n/2)的情况下求解一个规模为2n的搜索问题。本文从降低Grover算法的量子线路复杂度的角度出发,提出两种改进的算法,并将改进的算法应用到3-SAT问题上。1.为