论文部分内容阅读
视频拼接是将若干个摄像头采集的具有重叠区域的视频进行拼接,最终形成全景视频的技术,相比单目视频,它能提供更大尺寸的视频画面,从而可以同时展现更多的内容,也为相机阵列的高清显示奠定了基础。随着视频采集设备的不断廉价化,视频拼接技术成为计算机视觉图像领域的热点研究问题。这项技术在视频监控、超大图像采样和全景图合成等方面有着非常广泛的应用。然而由于图像配准和视频码流的复杂性,使得实时视频的拼接成为一个难点问题。本文利用三个普通摄像头,基于SIFT特征提取算法,对实时三目视频拼接技术进行了研究。视频流由帧图像组成,因此视频拼接是以图像拼接为基础。但是相比图像拼接技术视频拼接不仅对拼接的准确性有要求,同时对拼接的实时性也有着较高的要求。所以本文从图像视频拼接过程中用到的相关基础理论出发。介绍了图像拼接技术,其中主要对图像的特征提取进行了研究,针对特征点的信息含量高、抗噪声能力强的特点,确定本文选取基于特征点的特征提取算法来完成实时视频图像的拼接。由于视频拼接的核心是视频图像的配准和融合,本文针对特征点提取的Harris算法、SIFT算法以及几种基于SIFT算法衍生的特征提取算法进行了深入的对比研究。最后基于SIFT算法的稳定性和鲁棒性,采用SIFT算法来完成视频图像的特征提取。在提取图像特征点后,利用BBF算法进行特征配准,并结合RANSAC算法剔除误匹配,然后计算图像间的透视变换矩阵。针对视频拼接的实时性要求,对基于SIFT算法的帧图像拼接技术和视频采集进行了改进。通过固定摄像头位置采集视频,并结合首帧配准获取透视变换矩阵的方法实现了三目视频的实时拼接。