基于卷积网络的单图像和视频超分辨率重建方法

来源 :中北大学 | 被引量 : 0次 | 上传用户:chen19881220
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前单图像和视频的超分辨率算法广泛应用在诸如医疗影像、视频监控与安全、遥感等领域,且有着举足轻重的应用场合和价值,因此一直是学术的研究重点。本文利用这些年图像视频处理方面取得巨大成就的深度学习技术,结合深度学习方法实现了对单图像和视频的超分辨率重建任务,研究内容主要包括以下几个方面:(1)针对目前主流算法中网络结构越来越深导致重建精度和速度都达不到兼顾得到效果,本文提出了残差网络与目标检测RFB相结合的轻量型单图像超分辨率重建结构。网络可以更深层次提取图像更丰富、细节的特性信息。研究表明,RFB网络中的空洞卷积是捕获图像增大感受野的一种有效方式,而残差网络可以有效处理网络模型中梯度消失和爆炸问题。在图像重建模块,通过嵌入亚像素卷积来对通道进行像素重排,亚像素卷积与转置卷积相比较,最大的优势在于神经元的感受野大,可以给超分辨率重建模块提供更丰富的上下文信息,得到更好的重建结果。(2)针对大多数视频超分辨率方法严重依赖于运动估计和补偿的准确性,为解决严重依赖于运动补偿而带来的人工伪影等问题,本文提出了一种新的端到端的深度神经网络,它能通过隐式地动态上采样滤波器和残差网络来生成重建帧,并根据每个像素的局部时空邻域进行计算,以避免显式的运动补偿。利用本文提出的方法,采用动态上采样滤波器直接从输入图像中重建一个HR图像,并添加到通过图像超分重建中RFB残差网络结构计算出的细节中,有效利用帧间的时序信息,从而进行特征融合效果更佳,实现目标帧的超分辨率重建。与之前的方法相比,本文的网络借助一种新的增强技术,能够重建出更加清晰的具有时间一致性的高分辨率视频。本文通过多组实验来验证网络的有效性,来显示网络进行隐式地处理运动。综上所述,对于图像超分辨率从单图像和视频两个方面进行研究,把两种模型可以实际应用到遥感医学领域,具有很好的实际应用价值。
其他文献
在智能驾驶领域中,准确识别行人过街意图能够提前规避即将发生的危险,并且减少无效的等待时间,有利于提高行车效率。在现有的行人过街意图识别相关研究中,大多是使用提取到的行人姿态特征进行轨迹预测,但这类方法的数据类型较为单一,易受到环境因素的干扰。因此,本文在行人特征识别阶段将行人检测和人体关键点检测相结合,获取行人过街时的位置信息和关键点坐标信息,接着构建一种结合多头注意力机制的LSTM网络模型进行行
学位
老年人的安全监护是健康养老产业的首要问题,也是一个迫切需要解决的社会性难题。通过检测包含代谢状态和健康程度信息的人体心肺体征信号,可以准确获得老年人的实时状况,是健康监护的首选。近年来,基于调频连续波(Frequency Modulated Continuous Wave,FMCW)雷达的非接触式心肺体征检测技术被广泛研究,并取得了良好的成效。但其存在位姿杂波和人体体动干扰情况下心肺信号检测结果误
学位
激光干涉光刻(LIL)技术是激光干涉产生的周期性或准周期性光场分布,直接或间接作用在材料表面制造出可控的微纳图案。干涉图案可以利用激光器直接在样品表面烧蚀;也可以先记录在光刻胶上,再通过电镀、刻蚀等工艺转移到样品表面,产生微纳图案。激光直写技术是一种精密的激光写入技术,拥有无掩膜、精度高、制作效率高、成本低、加工灵活等优势。本文设计了无需光刻胶的直接激光干涉光刻系统,简化了光刻加工工艺,通过控制高
学位
当前行人重识别技术的重点研究方向有两个,特征提取和度量学习,前者不仅决定了模型的性能上限,而且也会影响度量学习。由于摄像头的安装角度和安装环境,会导致拍摄的行人图像存在前后角度不一致、图像不清晰和行人部分特征被遮挡等影响行人特征提取的问题。所以当前行人重识别的研究重点是如何提取到一个具有代表性的行人特征,本文的中心是围绕行人重识别所面临的挑战对基于深度学习的行人重识别方法进行研究和改进,主要的研究
学位
人脸识别课题是计算机视觉领域中流行以及长期存在的课题,随着对深度学习认识的逐步加深、大规模数据集的便捷获取、以及硬件加速平台的突破,深度人脸识别技术也相应迎来了质的飞跃,并在现实中得到了广泛的应用。但针对在现实中不同应用和场景下的问题,更精确和稳定的人脸识别以及更高效实时的识别速度仍然是一项重大挑战。本文主要从以下三个方面对人脸识别进行性能提升:更轻量化的人脸检测、更有效的特征提取网络、更有判别性
学位
图像质量增强是物体识别和检测、三维重建、目标跟踪等计算机视觉任务中不可或缺的预处理过程。视频图像去雨雾算法的目标是将被雨雾污染的图像恢复为不含有雨雾的清晰图像,从而达到图像增强的目的,现有的视频图像去雨雾技术只在去雾或去雨中的一项任务中表现很好,具有一定的单一性。本文研究能够同时完成去雨和去雾两种任务的算法,提出一种基于深度残差网络的视频图像去雨雾算法,主要工作如下:1)针对目前的去雾去雨算法网络
学位
红外与可见光图像配准可以使两幅图像实现几何对齐,充分提取两幅图像的互补信息,从而广泛应用于军情侦察、视频监控、智能驾驶等领域。尽管近年红外与可见光图像配准技术在各个领域取得了很大的进展,但由于红外与可见光图像间成像分辨率和像素灰度值的不确定性关系,如何得到提高两者的配准精度仍是一个技术难点,具有重要的研究价值。本文针对特征描述、特征匹配和几何变换参数估计对基于特征的红外与可见光图像配准进行研究,主
学位
古琴是中国最古老的弹拨乐器,也是中国传统音乐文化的活态传承。每个时代琴家们喜爱的琴曲各有不同,而经典的琴曲总是会被人们牢记并广泛的流传。由南宋琴家郭沔创作,吴景略先生演奏版本的《潇湘水云》就是一首经过岁月磨炼、时代沉淀而备受人们喜爱的琴曲。本文选用此曲作为研究对象,全文共分为五个部分:第一部分的绪论中介绍了选题缘起、意义及研究现状;第二部分简述了琴曲的创作背景;第三部分对演奏谱本进行了细致的梳理,
学位
随着社交网站的兴起,微博凭借着效率高、传播力强、信息多元化等特点,成为了国内外最受欢迎的社交网络信息平台,它给人们获取和分享信息带来了便利,同时也存在大量的网络谣言。谣言不论是对国家,社会还是个人,都带来了严重的负面影响。目前,在社交网络平台上最常见的谣言识别方法是人工识别,此方法不仅会消耗大量的人力、物力和财力,而且效率很低。所以,许多专家和研究人员采用传统的机器学习的方法进行谣言识别,虽然取得
学位
自2008年全球金融危机爆发后,技术预见受到了世界各国的高度关注,颠覆性技术也已经成为各国战略规划的重点。2017年,十九大指出要“突出颠覆性技术创新”。2018年,习近平总书记在两院院士会议上提出,要把颠覆性技术创新作为重要突破口。同年,中关村科技园区出台了支持颠覆性技术创新的指导意见。但是,颠覆性技术在发展过程中的极大不确定性造成了其在一段时间内不会被重视的特点,这也是在对其进行识别和预测时的
学位