基于深度学习的图像拼接算法研究与实现

来源 :西安工业大学 | 被引量 : 0次 | 上传用户:jerryzhang1805
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,图像拼接技术成为了计算机视觉领域的一个研究热点。传统的图像拼接技术在面对弱纹理或无纹理的图像时,如林区、天空以及海面等场景,由于特征检测能力不足,从而会导致拼接效果不佳;在深度学习中,有监督的方法由于数据集的标记工作存在人工成本高,时间开销大等问题,导致该方法难以得到普及;而无监督的方法由于图像间的视差问题,在面对大视差的待拼接图像时,其拼接结果也往往不太理想。为了更好的对林区图像进行拼接,本文提出了一个全新的、无监督的深度学习图像拼接算法,其在面对特征较少且拥有不同视差问题的林区图像,皆拥有较好的图像拼接效果。该算法主要分为单应变换和图像缝合两部分:(1)在基于transformer的单应变换网络中,以卷积神经网络强大的特征提取能力为基础,采用单应变换的方式,在求得图像间的单应变换矩阵后,利用transformer将特征映射通过单应矩阵进行空间变换,从而将大视差的待拼接图像转换为小视差的待拼接图像,其在保证图像内容完整性的同时,也降低了待拼接图像间的视差问题;(2)在基于注意力机制的图像缝合网络中,以VGG-16网络为基础,首先对小视差的图像进行缝合操作,然后采用卷积神经网络和SE注意力机制相结合的方式,解决了初步图像缝合后存在的色彩亮度不一致以及色彩失真等问题。经过实验对比,在主观视觉方面,本文所提出的算法在各类不同的林区场景拼接任务中,拼接缝自然且拼接伪影较少,同时色彩失真率较低;在量化分析方面,本文所提出图像拼接算法的PSNR值比SIFT算法提升了1.991 d B,比SFE算法提升了11.7921 d B,比DHN算法提升了0.803 d B;且本文所提出图像拼接算法的SSIM值比SIFT算法提升了7.37%,比SFE算法提升了8.68%,比DHN算法提升了2.32%。
其他文献
人类通信的本质是进行知识交换的过程。1953年Weaver提出了技术、语义、效能三层次通信模型,为现代通信系统的设计奠定了理论基础。随着人工智能的快速发展,通信设备的智能化水平和通信设备对外界的认知能力不断提高,为深入开展Weaver提出的第2层次的语义通信难题研究提供了可能,智能体语义通信也逐渐成为通信领域的一大研究趋势。现有的智能体通信工作主要集中在第1个层次,即通信符号如何准确传输,部分学者
学位
随着深度学习与人工智能技术的不断发展,人机交互在当前已经不再是一个陌生的话题,为了有更好的体验,人脸表情识别成为一个新的研究热点。深度学习的出现取代了传统手工提取人脸表情特征的方式,使得人脸表情识别技术得到了飞速提升,残差网络的提出使人脸表情识别的表现更上一层楼,但是如何设计一个好的残差网络,以便更有效地提取人脸表情识别所需的特征,从而提高其准确性,仍然是当前研究的重点。针对上述问题,本文选用Re
学位
通常要进行三维场景的构建需要真实环境的支持,室内环境的三维场景重建一般由激光雷达或视觉传感器完成,由于激光雷达成本高花费大,重建出来的结果缺少彩色信息,因此选用视觉传感器和SLAM系统,然而SLAM系统重建出来的地图依然是稀疏的场景地图,跟进工作无法继续。为了解决上述问题,本文主要利用多源传感器(深度传感器和IMU惯性传感器)融合的室内环境稠密三维重构方法,从而补充了缺失的室内环境数据,保证了正常
学位
随着现代医学模式的转变和人们对健康概念的更新,人们也越来越关注口腔健康和口腔美观,如何快速培养合格的年轻外科医生是一项非常紧迫的任务。因此,本文所开发的基于力反馈的口腔临床虚拟教学系统(Oral Clinical Virtual Teaching System,OCVTS)可以缩短口腔医生手术训练周期,有利于缓解现阶段口腔医生短缺的局面,为满足人们对美好生活的需要具备重要的现实意义。本文研究内容如
学位
随着第四次工业革命浪潮的到来,智能产品已经进入人们的视野。移动机器人是机器人的重要组成部分之一。在移动机器人所涉及的关键技术中,一个重要的问题是机器人导航。其中,在未知的复杂环境中,SLAM(Simultaneous Localization and Mapping,同时定位与地图构建)技术在机器人工程中发挥着至关重要的作用。由于单个传感器只能检测到有限的信息,它们在智能产品中的应用仅限于发出简单
学位
时间序列数据反映了时间和事务两者之间的变化过程,挖掘隐藏在时序数据中的规律变得非常重要。本课题研究的主要目标就是寻找一种采用波形匹配算法,以解决在海量的时序数据中查找与某一段波形相匹配的数据段此类曲线搜索问题。本文主要研究工作如下:1)CNN提取曲线特征过于随机,而且要查找的曲线目标是临时给出的,并没有多余的训练样本。本文使用相关时序数据集作为训练样本,解决提取曲线特征过于随机的问题,使用孪生神经
学位
随着数字化技术与手术导航技术的快速发展,口腔植入引导技术已成为现代口腔种植导航及相关诊疗器械研究的重点。本文针对当前种植导航领域的热点问题,研究了基于多传感器融合的车针目标跟踪方案,采用基于灯塔激光的VR定位技术和相机光学定位技术,提出的融合方案包括预处理阶段、基于不同传感器的初步定位解算阶段、数据融合测试阶段。研究包括基于不同传感器定位的目标位姿解算模型和种植导航的误差控制、多传感器融合方案的实
学位
随着5G网络的兴起,制作一张具有丰富艺术风格的图像并分享在网络社交平台账号上变得越来越流行。风格迁移方法主要是对整幅图像添加风格化的纹理、颜色等处理。基于深度学习的风格迁移方法可以将不同的艺术图像应用在内容图像上,最终生成风格化图像,极大的增强了人们的视觉感官。但这些方法都有个问题,那就是在风格迁移过程中容易忽略原本图像的语义信息导致内容图像失真、变形。因此,本文提出了一种新的改进方法,该方法可以
学位
晶粒度是钢材性能的一个重要评判标准,在微观角度,钢材表面晶粒呈现类似于细胞组织切片的颗粒状分布图像,晶粒的面积、长度、以及单位面积内晶粒个数等特征都影响着钢材的强度、塑性和韧性等性质,而这些晶粒特征在金相检测中通过不同金相等级来反映。目前对于金相等级的评定,最常用的方法还是通过人工依靠经验评定,人工判定金相等级很大程度上取决于工人素质,不确定程度较大。本论文在数字图像处理以及深度学习技术的基础上,
学位
欠压密黄土是处于疏松状态水敏性十分强烈的天然Q3黄土,其物理、力学特性受含水率的变化影响较大,当欠压密黄土吸水饱和后可形成饱和软黄土,易导致工程灾害发生。目前对欠压密黄土失水后的土性变化和工程问题研究较多,但其在地下水位回升阶段,土体在有上覆荷载情况下含水率逐步增大过程中的强度演化特性研究还有待进一步深入。本文基于GDS三轴试验系统,以具有较大孔隙比的欠压密黄土为研究对象,开展了欠压密黄土在水-力
学位