论文部分内容阅读
智能视频监控技术正在逐步取代或改造传统的视频监控系统,成为提升监控系统效能的主要发展方向,其技术核心在于视频分析,包括对视频图像目标的检测、识别、跟踪以及描述等。因此,如何在实时监控场景下对感兴趣目标进行锁定跟踪,并对跟踪的目标进行结构化语义描述是智能视频监控系统中至关重要的部分。目前车辆等刚性目标由于其结构比较规范,相应的跟踪和描述手段已经较为成熟,而面向行人目标的跟踪和描述研究对于完善现有智能视频监控系统具有尤为重要的意义。本文首先分析了目前流行的在线跟踪算法的基本原理,并重点介绍了其中比较重要的一种基于压缩感知的在线目标跟踪方法(Compressive Tracking,简称CT),进而结合实际监控应用场景下对视频跟踪实时性和可靠性的需求,研究单目标CT跟踪算法的改进;在此基础上,本文还深入研究了多人目标跟踪的主要问题,针对常见的目标间相互遮挡问题,提出了一种新的遮挡检测和处理方法,实现了多目标的锁定跟踪;最后,本文对行人目标的结构化描述进行了研究,具体阐述了基于XML描述语言的行人目标内容描述方法。详细介绍如下:针对单人目标跟踪问题,本文通过引入尺度变化和线性预测,对现有CT算法的不足之处进行改进,然后参考各种开源目标跟踪算法,构建目标跟踪算法平台,并通过设计多种跟踪算法的融合策略,进一步提高目标跟踪的准确率。针对多人目标跟踪问题,本文详细介绍了多目标跟踪系统的主要模块及其功能,然后重点分析了实际监控场景下多人跟踪的实时性问题和目标遮挡问题,基于卡尔曼滤波和行人特征分类器,对现有的基于数据关联的遮挡处理方法进行改进,实现在严重遮挡情况下的目标锁定跟踪。最后,针对行人目标的内容描述,本文根据所得到的行人目标跟踪结果,对目标内容进行XML格式的结构化描述,主要包括目标的颜色、纹理、形状以及空间位置等底层特征,同时将描述信息打包发送,实现本地客户端和远程服务器端之间描述流的发送与接收。本文对交通、银行等典型监控视频以及PETS等公共视频集进行测试,实验结果表明,本文所改进的行人目标跟踪与描述方法在监控应用场景下是行之有效的,将为后期海量监控视频数据的处理提供支持。