论文部分内容阅读
视频运动目标的检测与跟踪,旨在检测出视频序列中的运动目标,并沿时间轴跟踪运动目标的行进路线。该技术被广泛应用于智能监控、视频检索、模式识别等相关领域,同时也由于其与现代生活紧密相关而受到学术界的广泛关注。
一直以来,对视频运动目标的研究大都集中在像素域进行,不仅计算量大,时间开销也较高,无法满足都市生活的实时性要求。随着多媒体技术和视频压缩标准的发展,越来越多的视频以压缩的格式存储与传输,因此研究基于压缩域的运动目标处理方法更具有现实意义。在压缩域中直接检测和分割运动目标,无需对码流进行完全解码,需要处理的数据量大大减少,适合于对实时性要求较高的应用场合。对压缩域视频目标的检测与跟踪技术的研究紧随视频压缩标准发展的脚步,与以往的压缩标准相比,H.264/AVC以其绝对的优势被人们所关注,但大部分基于压缩域的运动目标检测与跟踪技术都直接套用像素域方法。本文以H.264/AVC压缩标准为平台,研究其编解码框架的基础上,详细分析了运动信息的产生原理,从运动目标检测与跟踪的角度上重新赋予运动矢量场和宏块分割类型以新的意义,从而提出一套基于H.264/AVC压缩域的运动目标检测与跟踪方法。本文对视频目标的处理主要分三个部分:
1.运动目标检测,以运动矢量和宏块分割类型为运动信息,提出一种自适应阈值的检测方法,从运动特征和纹理特征两个角度上考虑了运动目标的运动状态。并通过水平投影和垂直投影法确定出运动目标的位置及个数。实验中选取不同运动速度,不同目标个数的测试序列对本算法进行测试,并从主观数据和客观数据两个角度上分析了实验结果。
2.运动目标分割,以运动矢量和宏块分割类型为运动信息,提出一种改进的蚁群聚类算法,实现对压缩域中运动目标的分割。该算法充分考虑了H.264/AVC运动矢量场的特性,利用运动矢量场的固有特性自动选取聚类中心,实现对运动目标的准确聚类,同时利用宏块分割类型作为辅助信息修正聚类结果。实验中选取不同特点的测试序列对本算法进行测试,从计算时间、分割精度、以及主观分割效果三个角度上分析对比了实验结果,并分析了聚类中心的选择对分割结果的影响。
3.运动目标跟踪,以运动矢量作为运动信息,提出一种适用于压缩域的,基于均值偏移框架的运动目标跟踪算法。本算法以运动矢量方向角直方图作为跟踪信息,建立目标模型,避免了当目标和背景具有相似颜色分布形式时,丢失目标的情况。实验中选取不同特征的测试序列对本算法进行测试,并与采用颜色直方图作为特征的实验结果进行了对比。
总之,整个过程只需从码流中提取运动矢量和宏块分割类型,无需全部解码,在数据量大大减少的前提下达到了实时性要求。