论文部分内容阅读
全景图像拼接技术是一种将多幅具有重合部分的图像拼接成大视角图像或全景图的技术,作为图像拼接技术中的一个重要领域,其在军事、医疗、教育和旅游等方面均具有广泛的应用。随着图像拼接技术应用场景越发复杂,一种适应范围广、拼接精度高的全景图像拼接算法是目前迫切需要的。由于现阶段图像拼接技术中的特征向量往往是人工设计的,配准精度低、适用范围小,难以满足人们对多场景应用的需求。因此,论文提出一种基于改进AKAZE(Accelerated-KAZE,加速版KAZE)和RANSAC(Random Sampling Consensus,随机采样一致)的全景图像拼接算法,主要研究内容如下:(1)针对传统图像拼接算法在图像配准阶段采用的人工描述符稳定性弱、精度低等问题,研究出一种鲁棒性更强的通用CNN(Convolutional Neural Network,卷积神经网络)描述符代替人工描述符的图像配准算法。首先,设计好网络模型,利用 GL3D(Geometric Learning for 3D Reconstruction,用于3D重建的几何学习)数据集进行训练生成CNN描述符模型。然后利用AKAZE算法构建图像序列的非线性尺度空间并提取图像特征点,再利用训练好的CNN描述符模型与提取出的特征点图像块进行卷积操作来生成特征点的描述向量。最后使用RANSAC算法剔除错误匹配点对并计算其配准精度。结果表明,改进AKAZE算法在图像视角差异和光照差异较大时仍具有较高的配准精度,并且在各种常见的图像变化中,其配准精度高于传统AKAZE算法。(2)针对特征点过于集中时,计算出的图像变换矩阵模型参数局部性过高、图像拼接精度低以及传统RANSAC算法运行效率低等问题,对传统RANSAC算法进行了改进。先对图像特征点区域划分网格,然后通过只保留每个网格中匹配分数最高的特征点对来精简图像特征点。同时,在迭代过程中设定迭代次数上限和嵌套阈值的方法消除矩阵模型参数计算的冗余时间。结果表明,改进RANSAC算法的图像拼接精度高于传统RANSAC算法,并且其变换矩阵模型参数计算速度也要快于传统RANSAC算法。