论文部分内容阅读
全景图像拼接是计算机视觉领域重要的研究课题之一,主要用于解决单成像设备拍摄视角狭小的问题。全景图像拼接是指具有重叠部分的多幅图片,在不降低图像分辨率的情况下,通过全景图像拼接技术生成广视角的全景图像。随着计算机和数字图像领域研究发展,全景图像拼接在民用、军事等领域得到了广泛的应用,例如:虚拟现实、医学全景图像、汽车驾驶辅助系统、遥感图像处理等具体应用方面。当对多个摄像头拍摄场景进行全景图像拼接时,会涉及到拼接图像背景复杂、特征点数据量大、图像配准精度低、视频拼接实时性差等诸多问题。本文针对上述问题,主要从如下4个方面对视频拼接技术进行研究:(1)场景背景提取。由于经常有运动目标出现在不同的场景当中,想要几个场景同时自动获取干净的背景是比较困难的;通过对传统背景建模的方法比较与研究,如帧间差分法、混合高斯背景建模、Codebook等经典方法,并结合统计学中统计方法,采用了一种基于统计的背景提取方法。从而有效的提取出场景的背景图片,排除前景的干扰,为后续的图像拼接提供良好的拼接素材。(2)图像配准。采用SIFT算法提取图像特征点,并对特征点旋转、尺度、平移、光照不变特性进行了详细分析与推导;利用K-D树进行特征点匹配;根据错误匹配的特征点对,利用RANSAC算法提高匹配正确率;针对图像之间映射拼接图像所产生的累计误差,采用了束调整算法进行了调整。(3)图像融合。针对图像之间拼接存在明显接缝的问题,分析拼接图像之间常用的融合方法,最终采用渐入渐出图像融合方法进行拼接接缝处理。(4)视频拼接实时性。根据摄像头位置几何不变的性质,采取了对拼接素材背景和变换矩阵,进行隔断时间更新的策略,实现了视频的实时拼接。本课题所设计系统是在两个存在重合区域的摄像头同时监控的场景下,进行视频拼接。当存在运动物体较多干扰的场景下,本系统能够实现良好实时拼接效果。下一步将在较多摄像头下开展相关研究。