基于深度学习的红外与可见光图像配准方法研究及实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:aigeng87
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,各式成像设备的迅猛发展使得人们能够获取多种异源图像,将其整合并利用的前景越发广阔。图像配准技术是将异源图像拼接、融合等视觉任务提高精度的瓶颈和必要前提,也是图像处理领域的研究热点。可见光与红外光图像作为异源图像中的两种经典多模态图像,因其所处光谱的不同波段及信息互补性,其图像配准任务可以充分利用互补信息,减少场景目标的不确定性,提高后续图像分析的精度。然而,基于传统手工特征的配准方法往往对图像分辨率、边缘、背景噪声等较为敏感导致配准精度较低甚至失败,如何消除分辨率和光谱差异、提高配准精度是亟待解决的问题;同时,基于深度学习的红外与可见光图像配准算法在嵌入式或移动端等计算资源有限的设备上部署和应用也是一个具有挑战性的任务。本文针对红外与可见光图像配准进行算法研究,结合深度学习在计算机视觉领域的显著优势,构建出一种通用且高效的红外与可见光图像配准框架,并采用边缘设备部署方式实现了安卓平台的部署应用,主要工作总结如下:第一,针对红外与可见光图像分辨率、光谱差异过大以及手工特征配准精度低的问题,本文提出一种先目标检测后模态转换再光流变形的图像配准网络框架MTFRN。该框架是一种三阶段的网络结构,由YOLOv5检测模块、模态转换模块和光流场模块构成。首先,由于缺乏公开的红外与可见光图像配准数据集,本文构建了五种类别的数据集,每种类别100对图像,共1000张图像。考虑到可见光图像背景复杂、目标尺寸不确定,该框架首先利用YOLOv5模块检测出可见光图像中的单目标并裁剪缩放;考虑到红外与可见光图像色彩差异巨大,该框架接着利用条件生成对抗网络并结合SSIM测度进行模态转换,由裁剪缩放后的可见光图像生成伪红外图像以减小色彩差异;考虑到手工特征迭代产生的变换参数表达能力弱使得配准精度低甚至失败,该框架最后采用光流场网络并结合SSIM测度进行像素层的空间位置变换。实验证明本文提出的MTFRN框架在红外与可见光图像配准任务中具有更好的配准效果。第二,针对基于深度学习的红外与可见光图像配准算法在嵌入式或移动端等计算资源有限的设备上部署和应用困难的问题,本文采用边缘设备部署方式实现了MTFRN算法的安卓平台部署应用,具有无需联网、高效等优点。首先,进行了配准系统的需求分析,包括系统功能性和非功能性需求分析。其次,利用开源前向推理框架NCNN、Android NDK和JNI接口等技术实现了前向推理模型的构建和后处理。然后,阐述了系统中每个模块的详细设计与实现。最后,从功能和性能两个方面对MTFRN系统进行了测试。综上所述,本文提出的全新红外与可见光图像配准网络框架MTFRN,能够有效解决红外与可见光图像分辨率、色彩差异过大以及手工特征配准精度低的问题,提高了复杂场景下的配准精度和鲁棒性,具有创新性;同时,将所提算法应用于生产实际,实现了基于深度学习的红外与可见光图像配准安卓平台的设计和开发,促进了图像配准的实际应用。
其他文献
遥感图像分类是遥感图像处理的重要组成部分,已经在城市制图、精准农业、森林变化检测、环境保护和军事侦察等多个领域进行广泛地运用,具有重要的研究意义。近年来,集成学习算法成为遥感图像分类领域的热门研究方向。与单分类器相比,集成学习不仅可以利用多个基分类器之间的差异性,提高模型的泛化性能,而且能够使各个基分类器的信息进行互补,从而显著提升分类系统的准确性和鲁棒性。本文以集成学习为核心技术,开展遥感图像分
学位
三维重建是通过计算单个或多个相机采集的二维图像间的关系,来恢复潜在的三维模型的技术。作为计算机视觉的重要问题之一,三维重建已广泛应用于增强现实、摄影测绘、自动驾驶等领域。然而,由于输入图像中往往具有场景变化大、可用信息少等特点,三维重建过程中容易出现特征点定位误差大、相机姿态不正确、模型存在空洞等问题。针对上述问题,本文通过研究特征点提取、视图重建等方法,设计并实现了一种基于深度学习的三维重建系统
学位
随着移动通信技术的发展,人们开始研究如何在移动终端实现目标定位、手势识别、成像等感知功能。目前,移动终端上的成像功能主要依靠光学摄像头实现,光学成像发展多年,技术成熟,但是光学摄像头容易受光线条件影响,在弱光或无光环境中难以实现成像。而基于太赫兹阵列的成像系统不受光线影响,能够实现非可视环境下的成像。太赫兹电磁波波长短的特点也易于设计出适合移动终端使用的天线。此外,太赫兹波具有的高宽带性能够实现高
学位
随着信息活动的日益频繁以及无线通信手段的日新月异,海量的信息交流难以避免地产生了大量的射频干扰源。在地球遥感应用中,由于微波辐射计所测量的大气和地表的信号较微弱,使得设备观测信号受到了严重的射频干扰源污染,进而难以反演得到精确的遥感信息。综合孔径微波辐射计的宽视场以及有限的空间频率采样导致了射频干扰源在成像结果中存在吉布斯现象,因而射频干扰源对综合孔径微波辐射计成像性能的影响更为显著。为了缓解当前
学位
目标跟踪始终是科学研究中的热点领域,随着社会的不断发展,跟踪场景变得日益复杂,多目标跟踪技术也随之得到快速的发展和应用。群目标跟踪的概念随之被提出,群目标跟踪中跟踪的目标是由多个单目标组成,它们以相同的速度或方向进行移动,如无人机群,舰艇编队等。目前群目标跟踪更是被广泛的应用在各个领域,例如智能监测、机器人视觉导航,室内定位等,随着研究的深入,越来越多基于随机集(RFS)的滤波算法涌现出来,例如概
学位
报纸
在医学图像领域,图像融合是一种重要的医学辅助技术,可以综合处理不同医学成像设备提供的图像信息,并进行有效组合,获得一幅信息更加丰富的结果图像。本文研究了基于反卷积神经网络及直觉模糊推理的CT/MRI医学图像融合算法,具体研究内容如下:研究了基于多方向梯度的直觉模糊推理CT/MRI图像融合算法。为了获得能够充分表征源图像的特征图,本文采用基于高斯方向滤波器的反卷积神经网络,根据待融合数据,设计了图像
学位
高校实验教学是学生掌握专业技能与培养解决实际问题能力的重要途径,其中,学生实验课堂表现是实验成绩评估的重要环节。但是,近年来随着学生数量的增加与实验内容复杂度的提升,单纯依靠教师已难以及时、精确地评估学生的课堂表现。因而有必要将人工智能技术融入到实验课堂教学中,通过智能视频检测方法实时识别学生的实验课堂行为,提高了课堂表现评估的精确性和实时性。本课题充分考虑大学实验课堂的具体情况和需要,为解决学生
学位
同步定位建图技术(Simultaneous Localization and Mapping,SLAM)是在未知区域中实时获取自身定位和环境位置信息的技术。目前,单目SLAM存在建图稀疏的问题和运动较快时容易发生定位丢失的问题。针对这些问题,本文对基于特征点法的单目ORB-SLAM2系统进行改进,提升了系统建图的稠密程度和部分快速运动场景下的鲁棒性。本文工作如下:(1)针对单目ORB-SLAM2系
学位
在驾驶员疲劳检测、教育和人机交互等应用领域,理解人类情绪的状态或者目的是必要的。由此,研究者向人脸表情识别投入了更多的关注。大量研究已经证明了对于解决识别任务,基于卷积神经网络方法是强大且成熟。但是,当我们把上述理论应用于多姿态人脸表情识别任务时,依然会存在很多问题。事实上,不同姿态下人脸重要的局部区域会有所不同,而现有深度学习框架中的注意力机制对这些局部区域的鉴别性信息的关注度不足;另外,人脸表
学位