论文部分内容阅读
在智能视频分析系统中,运动目标的检测与跟踪是一个基础核心的环节,其性能直接关系到后续动作识别、行为理解等高级语义处理的精确性。由于视频监控场景的复杂性、各种干扰因素的多发性、并发性等特点,研究高精度、低耗时以及强鲁棒性的运动目标检测与跟踪算法具有重要意义。本文利用机器学习和计算机视觉等相关理论,针对复杂视频场景中的运动目标检测与跟踪问题进行了深入研究。主要工作包括以下几个方面:(1)针对复杂视频监控场景中的光线变化与移动阴影造成运动目标的检测结果包含大量假阳性像素点的问题,首先对局部二值纹理模式(Local Binary Pattern,LBP)进行深入研究,并在此基础上提出了一种改进的局部纹理特征描述子。该特征描述子相比传统LBP有更强的噪声鲁棒性,并具备有灰度尺度不变性。将该纹理特征与颜色特征融合进行多维核密度估计,建立背景的概率模型。为了提高算法在多模态背景场景中的检测精度,在前景检测中结合像素的邻域相关性以抑制虚假前景。在标准检测数据集上的实验表明,与基于纹理直方图的算法相比,该方法能在光线缓慢变化和包含运动阴影的场景下综合性能提高17.5%;在各类场景下与其它性能突出的方法进行比较,该方法的平均检测性能提高了0.12%,而处理速度提高了50%。(2)传统颜色空间易受到环境干扰而产生失真,将颜色属性空间应用于运动目标检测中,提出一种基于区域颜色属性二阶矩直方图的背景建模方法。将RGB颜色空间映射到降维的、鲁棒的颜色属性空间,再引入像素的空间结构,在局部区域内建立基于颜色属性的二阶矩直方图,使用若干个不同权重的二阶矩直方图构建背景模型。在模型的匹配中,该方法兼顾特征的相似度和空间结构的相似度,从而提高了检测的精确度。降维的颜色属性提高了特征的鲁棒性和时效性,二阶矩直方图引入的像素位置信息提高了背景模型的准确性。检测时通过学习率来控制各模型直方图及其权重的更新,并且针对算法中涉及的参数进行了详细讨论,给出了可行的取值。实验结果表明,该方法在动态背景干扰场景中,相比其他检测方法其综合检测性能提高了近13%。同时,该方法在6类场景中的整体平均综合性能也是最优的,可达到75.18%。(3)针对统计模型背景建模算法将视频的各个帧和帧内像素视为独立不相关的个体、没有充分发掘高维数据的内在本质这一问题,本文对基于鲁棒主成分分析的运动目标检测算法进行研究,提出了一种基于自适应低秩稀疏分解的运行目标检测算法。首先用背景模型与待求解的帧向量构建增广矩阵,然后使用鲁棒的主成分分析算法对降维后的增广矩阵进行低秩稀疏分解,分离出的低秩部分和稀疏噪声分别对应于视频帧的背景和运动前景。最后,使用增量奇异值分解方法对背景模型迭代更新。实验证明,该方法在传统主成分分析中引入自适应的过程,可以提高模型的鲁棒性。在包含光线变化、多模态背景以及恶劣天气的三个复杂场景中,该方法的综合检测性能指标F1值分别提高了6%、8%和7%。自适应算法分批载入视频帧的方式有效降低了算法的延迟,在包含多模态背景扰动的复杂场景中,检测时间效率提高了19.3%。(4)针对粒子滤波跟踪算法的外观模型易受环境干扰、粒子重要性重采样中的粒子贫化和粒子退化问题,构建了基于多线索多特征的粒子滤波单目标跟踪算法。通过对传统灰度行程矩阵进行模糊聚类,得到了一种稳健的模糊统计纹理特征,将其与体现像素相关性的Histon直方图结合构建目标外观模型。针对粒子滤波中粒子易退化和贫化的问题,使用聚类算法得到自适应数量的高权值粒子,用这部分粒子来近似得到更为准确的目标状态估计。重要性重采样阶段,这部分高权值粒子得以保留,而其余粒子在估计的目标状态周围重新采样得到,有效克服粒子退化并保持了粒子的多样性。将本文方法与粒子滤波框架下性能突出的跟踪算法进行比较,其平均跟踪成功率和平均跟踪精度分别提高了4.4%和2.8%。与多个流行的、性能优越的跟踪算法进行比较,该方法在目标形变、光照变化和背景扰动三类场景下能得到最优的跟踪精度曲线和成功率曲线。