基于深度学习的图像超分辨重建研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:fanfansis
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像是网络时代信息传递的一种重要载体,相对于文字、语音等传统媒介,图像可以直观高效的获取信息。高分辨率(High-Resolution,HR)图像通常包含大量的图像纹理细节,因而可提供丰富的信息,具有更好的观感,便于人们更加准确、快速地获取所需信息,做出准确判断。但由于硬件采集设备和网络传输条件的限制,通常人们获取的图像多为低分辨率(Low-Resolution,LR)的。图像超分辨率重建(Super-Resolution,SR)技术就是着眼于从软件算法角度实现由低分辨率图像重建出高分辨率图像。基于深度学习的图像SR算法是通过构建多层卷积神经网络以建立输入与输出之间非线性的端对端映射关系,通过训练拟合相应的映射函数,目前在图像SR领域中展现出良好的重建效果,已成为近年来该领域的研究热点。由于退化的LR图像与原始的HR图像相比丢失了很多细节性的信息,因而同样的LR图像可能对应多幅不同的HR图像,是典型的一对多问题,因而SR问题是一个严重的病态问题。现有的基于深度学习SR模型更关注于增强SR算法中映射函数的拟合效果,对缩小该病态问题的解空间开展的研究相对较少。本文以深度学习技术为基础,针对单一图像的SR重建问题展开研究,提出了两种基于深度卷积神经网络的图像SR算法,分别如下:1)基于闭环双重注意力机制的图像超分辨率重建算法。现有的基于深度学习的图像SR算法对不同空间和通道维度的特征采用均等处理的方法,该方法导致大量的计算资源浪费在不重要的特征中,制约了算法性能的提升,同时为有效利用更多的邻域信息进行像素SR重建,算法通过加深网络深度以增大卷积核感受野来捕捉远程的信息依赖。这种方案使得SR算法复杂度高,训练收敛难度大、重建图像质量较差。为解决该问题,本文提出由空间注意力机制和通道注意力机制组合构建双重注意力机制方法,通过学习不同通道的重要性权重以及空间图像块间的相似性的权重值,从而对不同位置的特征重要性进行建模,以进一步增强重要的特征,抑制不重要的特征。为弱化一对多带来的病态问题,算法中构建了双路对偶回归结构,在LR图像到SR图像的原始映射的基础上,增加了SR图像到LR图像的对偶映射,通过该正则项的构建一定程度的约束了解空间。2)基于可逆神经网络的图像超分辨率重建算法。为进一步弱化一对多现象带来的病态问题,本文引入了流模型结构,通过其可逆变换性质以充分利用图像退化模型结构中的先验信息,由流模型构建了LR图像和HR图像之间一条双工通路。依托深度学习技术和流模型基础原理,构建了可逆神经网络结构,在流模型中通过深度神经网络实现映射函数拟合,形成了类似编解码结构的可逆转换。为实现流模型结构,采用像素重排方法将HR图像进行分解获得高通道和低通道信息,在正向退化拟合过程使得高通道信息拟合各项同性的高斯分布,低通道信息拟合LR图像。可逆结构的引入使得图像重建效果取得巨大的飞跃。经过实验验证,本文提出基于闭环双重注意力机制的图像SR重建算法相对于现有的图像SR算法重建图像的质量有明显的提高,但该模型方法仍复杂度较高。基于可逆神经网络的图像超分辨率重建算法由于引入流模型结构构建了可逆的算法结构,使得图像重建质量相对于基于CNN的SR算法有了极大的提升,同时网络参数非常小,收敛速度快。
其他文献
凝胶性作为大豆蛋白最主要的性质之一,在生活与工业上的应用非常广泛。为了进一步深层次了解大豆蛋白凝胶性的影响因素,本试验从大豆(齐黄34)籽粒中分离出7S和11S大豆球蛋白,对7S球蛋白进行了分离,获得αα’-亚基和β-亚基。控制7S与11S大豆球蛋白的比例为1:1,调整7S球蛋白中50%的亚基构成,制备不同7S亚基比例(β-亚基与αα’-亚基的比例分别为0:1、1:4、2:3、3:2、4:1和1:
学位
功能梯度碳纳米管增强复合材料(Functionally Graded Carbon NanotubeReinforced Composite,简称FG-CNTRC)具有轻质高强的优良特性,在航空航天、人员及结构防护等领域有广阔的应用前景,FG-CNTRC板结构的低速冲击响应也引起了相关研究人员的广泛关注。针对现有研究的不足,本文基于弱形式求积元法(Weak Form Quadrature Elem
学位
声表面波(surface acoustic wave,SAW)器件由于具有信号处理简单方便、很强的抗辐射功能、动态范围大、适于批量化生产等优点一直受到学者们的青睐,广泛应用于移动通信系统、电视、广播、各类军用雷达、传感器、滤波器中。压电材料和叉指电极是决定声表面波器件性能的关键要素。氮化铝压电薄膜具有高声速和温度稳定性好等显著优点,是与高声速衬底材料结合制备声表面波器件的理想材料;石墨烯可以维持巨
学位
时间序列的相似性搜索,是根据给定的查询目标在时间序列候选数据中正确、快速查找到符合要求的数据。随着信息化技术的广泛应用,以及物联网技术的蓬勃发展,时间序列呈多元化的发展趋势,给相似性搜索工作带来极大挑战,主要体现为:(1)由于多元变量之间存在复杂的相关性,以及现有多元时间序列数据普遍缺少先验信息的数据现状,对多元时间序列相似性进行精确度量的难度较大;(2)传统的空间索引结构在处理高维数据时面临空间
学位
作为一种集散热性好、准直性高、易于集成和维护等诸多优势为一体的脉冲激光光源,全光纤脉冲激光器一直是激光领域研究人员的研究重点。目前主要是通过调Q(Q-switched)和锁模(mode-locked)技术来实现脉冲激光输出。近十年来,探索二维材料的非线性光学特性,将其作为可饱和吸收体进行被动调Q或被动锁模来实现脉冲激光输出逐渐发展成为集光学、材料和化学的前沿交叉研究领域。然而,受限于其自身的物理化
学位
轴承是动力装置中广泛应用的一类关键部件,其状态识别与剩余寿命预测技术一直是研究的热点内容。本文基于油液与振动信号融合参数,利用深度学习特征提取方法,并与支持向量机(SVM)相结合,研究了动力装备轴承关键部件状态识别与剩余寿命预测方法。主要研究内容包括:(1)在分析深度置信网络(DBN)、深度自动编码器(DAE)以及卷积神经网络(CNN)三种深度学习模型的原理、构成基础上,对其优缺点及适用范围进行了
学位
近年来,以星间链路技术为核心的低轨卫星网络发展迅猛,巨量卫星星座建设给空间电磁频谱资源管理与使用带来新的挑战,频谱资源稀缺、信号干扰复杂成为星间通信新常态。将认知无线电技术应用于星间通信环境,实现星间频谱资源动态分配,将有助于提高频谱资源利用率,增强星间通信的抗干扰能力。使用调制识别方法对星间信号调制特征进行识别可以为频谱资源动态分配提供基础数据,而经典的调制识别算法对复杂场景的适应性差,识别准确
学位
成像导引头是成像制导武器的核心部件,主要担负复杂战场环境感知、目标识别、目标跟踪、干扰对抗和制导信息测量与解算等任务。其中,目标识别是成像导引头的关键技术之一,目标识别的识别率、精度和环境适应能力等性能直接决定了成像导引头及制导武器的作战使用和打击效果。目前,成像导引头主要采用以模板匹配为代表的目标识别技术,难以满足复杂战场环境带来的挑战。本文以成像导引头的研制为背景,研究基于深度学习的成像导引头
学位
自适应光学系统中,波前传感器的准确性和鲁棒性极大地影响像差探测能力和校正效果。在波前振幅分布不均匀或信标光能量不足的情况下,哈特曼波前传感器由于存在子孔径缺光现象导致传感精度下降,而无波前传感自适应系统由于收敛速度较慢难以用于实时性要求较高的应用场景。如何实现复杂条件下近实时波前测量是亟待解决的实际问题。基于深度学习的波前传感可以看作一种新型波前测量方法,该方法利用系统中远场光强分布,反演得到近场
学位
三维点云数据含有被测场景物体表面丰富的信息,具有海量、高密度以及高精度等特性,已成为用来理解、分析和语义解释三维自然场景的一种主要数据类型。其中,基于三维数据的复杂场景多态目标语义分割的研究具有重要的军事和民用价值。本文以室内三维点云数据和常见物品三维点云数据为研究对象,对三维点云语义分割问题展开了研究。本文的研究内容主要包括以下三个部分:(1)介绍了三维点云语义分割领域目前的发展现状,对当前国际
学位