论文部分内容阅读
视频拼接是将含有重叠区域的视频图像经过配准融合,得到宽场景视频的技术。视频拼接技术是数字图像处理及机器智能方面的研究热点,目前视频拼接在车载导航、视频监控、场景理解、虚拟现实等方面领域的应用越来越广泛。 本论文研究了视频图像拼接的流程及过程中所用到的关键技术,分析比较并总结了视频图像采集与预处理、特征选取、图像匹配和融合的方法、性能及存在问题。主要研究工作集中在以下四个方面: 1.对双目摄像机采集到的图像经过预处理和柱面转换之后进行配准,选择8参数投影透射变换模型作为双目视频之间坐标变换的模型,用 RANSAC方法迭代估计最适合的图像间单应性矩阵,通过渐入渐出加权融合最终拼合两个摄像头获取的视频图像,大量的实验验证了系统算法的可行及有效性。 2.实际的三维世界通过摄像机映射到二维平面时,无法完全匹配景深差距过大的特征点,从而干扰图像间单应性矩阵的估计。论文研究比较了 SIFT及 SURF配准算法,并通过视频图像每一帧都进行特征提取及匹配来改善这个问题。 3.为解决在多摄像头的公共区域中有视差角度以及运动物体等此类问题,论文提出一种基于 SURF和动态 ROI(Region of interest)方法的视频图像快速拼接方法,对视频每一帧都匹配拼接。由于选取了特征提取的动态 ROI之后,重叠区域之外则不进行 SURF特征提取,避免了 ROI之外的误匹配特征点对,提高了特征匹配的精准度,同时减少了程序的耗时。通过实验证明,经过动态 ROI规定特征搜索范围之后,算法运行的速度大约是原始 SURF特征提取算法的2.34倍。 4.人眼看到的静止不动的场景,摄像机连续采集到视频图像前后帧也会产生灰度差异,从而对特征提取及匹配造成影响。由此得到的摄像机图像间单应性矩阵每一帧都不同,造成拼接视频的抖动现象。本文先采用 RANSAC方法估计8参数变换模型得到单应性矩阵,再通过平滑前后帧图像间单应性矩阵解决视频拼接后图像因存在误匹配造成的抖动问题。 最后,利用 VS2008实现了上述基于双目摄像头的实时视频拼接系统,可根据需要对双目摄像头的角度和移动方式进行调整,该系统使用方便、易于扩展。通过大量的实验,证明该系统可以自适应的对存在一定重叠和旋转的视频图像进行拼接,获得无缝、高清的大视场视频,具有良好的图像质量和实时性。