基于特征的多路视频实时拼接技术的研究与实现

来源 :北京工业大学 | 被引量 : 7次 | 上传用户:laopoxqq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多路视频实时拼接技术是计算机视觉、虚拟现实等领域的研究热点,在交通监控、视频会议、家庭娱乐等方面有广泛的应用。目前可以通过广角镜头或者鱼眼镜头获取全景图像,但是这些设备一般价格昂贵,同时也存在很大的畸变等问题。实时视频拼接技术的本质是图像的拼接,但是其又与图像拼接不同,对实时性要求更为严格。本文通过研究全景视频实时拼接技术,对多路视频实时拼接的视频采集与同步、图像预处理、特征提取、配准、图像颜色矫正、图像融合等步骤给出了详细的原理介绍和具体的算法实现,最后利用C++语言设计并实现了四路视频流实时拼接系统。本文的主要研究内容如下:(1)在视频采集阶段,利用操作系统生产者-消费者模型和多线程机制,实现了实时视频流的采集和同步。(2)在配准阶段,利用经典的SIFT特征提取算法,结合一定视频采集场合下的特定情况,对特定区域进行特征查找,然后利用带优先级的KD树索引机制,提高了特征提取、匹配的速度。(3)在融合阶段,首先利用最优化思想,进行颜色矫正,使得相邻图像间的颜色亮度整体一致;其次,构造了一个度量误差矩阵,代表图像重叠区域的颜色和结构差异,使缝合线尽可能地穿越图像的平滑区域;最后结合高斯-拉普拉斯金字塔图像融合,保证了拼接效果。(4)设计并实现了基于特征的多路视频实时拼接系统,通过四路网络摄像机采集视频流,在拼接过程中,充分结合CPU和GPU各自的优点,利用CUDA并行计算架构,构建两者协同工作的编程模型,对多路实时视频流进行实时拼接,统计相关试验数据,进行效率分析,CUDA改进版本的加速比达到10:1,表明本文实时视频拼接系统切实可行。
其他文献
web2.0带领互联网走进了一个新时代,用户是互联网的核心,生产数据的同时也在消费数据。互联网的普及和互联网用户数量的迅猛增长使得互联网上的信息呈现爆炸式的增长,带来了