图像超分辨率重建深度学习模型研究与应用

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:lolotang530
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像超分辨率技术一直是计算机视觉等领域的热门研究方向,其主要任务是将一张低分辨率图像通过某种规则恢复成高分辨率图像。低分辨率图像与高分辨率图像之间的差异中起到决定性作用的并非低频信息,最主要的原因还是在于两图之间高频信息的差距,超分辨率技术即为了复原图像中缺漏的高频信息。随着硬件与机器学习的发展,深度学习的相关研究也逐渐深入地涉足于超分辨率技术领域。自2014年来,基于深度学习的超分辨率技术研究规模逐年壮大,同时相关技术也取得了极大的进展。在该领域里,如何构建网络提取更多有效的特征信息,提高图像的重建质量是其主要研究方向之一。本文针对SISR(single-image super-resolution)问题,着眼于对超分辨率重建深度学习模型的研究,并将研究的成果应用到超分辨率技术中。近年来,该方向的研究者们都在模型的组建方法上下功夫,大多都忽略了从基础上进行模型的改进,即用于提取特征信息的卷积神经网络CNN。由于标准的卷积神经网络在进行图像特征提取时总是以固定形状的滑块来操作计算,而现实中的图像通常都是包含几何形状的物体,说明CNN由于自身机制的问题而导致其对物体几何形变的拟合能力较差,而这就有可能会成为限制超分辨率重建质量提升的因素。本文引入可变形卷积DCN的思想,将该思想与超分辨率技术相结合,研究基于DCN的超分辨率技术。可变形卷积通过引入偏移量,扩展CNN在图像区域内的采样范围,增大感受野,提高网络对特征提取的能力,同时也提升了网络的鲁棒性。本文的研究目标就是验证其对于超分辨率技术提升的有效性、分析归纳出可变形卷积在超分辨率模型中的应用方式。本文做出的主要贡献如下:一是通过将可变形卷积与SRCNN模型相结合,依照规律提出了七种SRCNN的变式模型。接着通过大量实验,验证了可变形卷积在超分辨率重建中的有效性,提出了卷积核模拟现实中物体几何形变的新思路。并根据实验结果分析出了可变形卷积在构造超分辨率重建模型时的应用方式。二是对上述可变形卷积实验结论的应用,结合现有的模型算法与思想,提出了基于可变形卷积的超分辨率重建模型SRDCN和SRDCN+。两种网络结构相似,都运用了残差学习及Block思想,提出可变形卷积块的局部模型结构。两种网络引入了残差学习思想的同时,也能够避免出现梯度消失或爆炸、加快网络收敛。SRDCN与SRDCN+还在重建模块使用了亚像素卷积思想,一定程度上减少了信息损失和计算量。最后通过大量对比实验对两种网络的图像重建质量进行测试,并且与其他经典网络模型进行对比。根据实验结果分析,无论是在PSNR与SSIM的对比上,还是主观视觉效果上,本文提出的模型SRDCN+都明显优于其他模型。
其他文献
随着配网的发展和配网市场的建立,传统的馈线终端设计简陋、使用不便利且处理能力较弱,它不能实现自动配网系统数据采集和电源可靠度的要求。而对智能馈线终端LY-F30而言,其核心功能控制和测量,对配网自动化的建设起着关键作用。作为一种新型的馈线终端,在配网领域内得到了广泛的运用。新型的馈线终端LY-F30作为物联网和嵌入式技术在配网领域的一个应用典型,为目前安全性较低、使用不灵活处理能力较差且设计单一等
随着动车组列车行驶速度的不断提高以及铁路网络的不断完善,电气化铁路运输已然成为我国运输的主要手段,它以速度快、载重大、能效高、不污染环境等优点而被广泛应用。但是随着电气化铁路运输的发展,也带来了相应的电能质量的问题,考虑到动车组列车中很多元件都是非线性的,它在行驶时会形成谐波电流,这些谐波电流都会通过牵引变电站流向地区电网并对地区电网的稳定运行造成了隐患。伴随着我国越来越多电气化铁路的兴建以及投运
AGV是一种通过不同的导航方式引导,然后通过差速或者舵轮运动的自动引导车,由于物流行业的兴起,渐渐成为工业4.0的主力军,因此得到自动化行业学者的高度重视,尤其是AGV路径跟踪这方面的问题,是目前AGV行业最难解决也最需要解决的。AGV路径跟踪问题归根到底是消除AGV与设定轨迹偏差的问题,本文首先结合无人驾驶技术中应用得较为广泛的LQR控制和MPC控制,对激光导航方式的单舵轮AGV的路径跟踪控制方
同步定位与建图(Simultaneous Localization and Mapping,SLAM)是机器人实现全自主移动的技术关键,SLAM技术在无人机、无人驾驶、虚拟现实等领域已经实现了多样化的运用。视觉SLAM一直是热门的研究方向,随着计算机视觉和人工智能技术的发展,多传感器融合SLAM、增强语义SLAM、非特征点SLAM都是研究的热点。目前,基于特征点的视觉SLAM技术研究相对成熟,将S
DC-DC(直流-直流)变换器作为直流电能转换设备的核心元件,备受电力电子领域学者的关注。近年来,随着便携式电子设备的市场规模呈爆炸式增长,安全高效的电能转换元件对于电源设备的重要性则愈加突出,针对DC-DC变换器的研究也愈发重要。目前已有较多高效的控制方法应用于DC-DC变换器的控制研究中,但这些方法尚存在一些不足,有待进一步优化与改进。本文基于切换仿射模型,研究了DC-DC变换器的采样控制方法
农作物病虫害是农业生产中粮食安全长期存在的隐患,而农药的过度使用将造成过多残留量,将严重影响人的身体健康。随着人工智能在农业的应用越来越广泛,由于人工识别农作物病害带来的效率慢和准确率低等问题逐步得到解决,农业病害发展初期防治的最佳时机成为重要目标。深度学习技术应用到农业病害的识别上取得很好成效,但目前还存在样本不平衡、困难样本分类难等问题。论文针对这些问题,提出几项算法的改进措施并搭建农作物病害
工业机器人已经开始用于物流本包裹分拣业务中,它利用计算机视觉技术实现自动化流水线的分拣模式,自动化水平的不断提升。然而,工业机器人分拣系统在实际使用中,由于分拣类别不同,系统性能要求、分拣精度等方面也存在差异。物流成交量比较高的状态下,极容易出现“错件”分拣、快递分拣速度低等问题,将严重影响快递包裹分拣。本设计对工业机器人分拣系统的性能、功能等方面进行研究,用机械臂代替人工分拣,进一步提升了工业机
当今互联网技术的飞速发展的同时,伴随着海量又杂乱无章的网络信息产生,因此采取有效的信息管理手段是很有必要的。新闻文本作为信息的重要载体,如何对海量的新闻文本进行分类以挖掘出有价值的信息成为当前热门研究课题之一。面对中文新闻文本分类任务,传统的文本表示方法存在无法解决一词多义和不能为文本提供丰富的上下文语义表征等问题。通过文本表示方法获取Embedding表示,在文本特征提取的过程中,文本特征之间缺
随着科学的进步和发展,人与机器之间的联系越来越密切。在计算机的性能不断提升的情况下,人和计算机的人机交流会更加频繁。手势是人机交互的一种方式。手势识别是通过计算机分析每一个手势的具体含义,通过对手势的识别,可以得到人们传递的信息,从中得到的信息可以直观、智能做到人与计算机机之间的交互。研究者们对包括步态、手势、人脸、姿态等交互技术进行了广泛的研究。在这些交互方式中,使用手势交互比较自然,由于其方便
随着基于位置社交网络(Location Based Social Network,LBSN)的兴起,兴趣点推荐成为了生活中不可或缺的服务。因而兴趣点推荐在推荐服务领域中成为了热门的研究领域。在兴趣点推荐中主要面临两个问题,一个是用户对兴趣点评分数据的稀疏性问题。另外一个是用户与兴趣点的特征向量表示问题。传统的协同过滤推荐算法虽然能解决数据稀疏性问题,但是推荐效果并不理想。近年来随着深度神经网络算法