论文部分内容阅读
运动目标的跟踪是视频处理的热点,随着视频压缩技术的逐渐普及,压缩视频格式目前已应用到科学研究、工农业生产、军事、公安、医疗卫生、教育等许多领域。在压缩视频中对运动物体跟踪成为新的研究方向,而新的研究方法必须根据压缩视频原理相应建立并充分利用压缩视频数据流中帧与帧的数据相关性,以流码的形式找出运动物体的数据流轨迹。传统的目标跟踪常常在非压缩视频格式中,通过目标的颜色、几何形状的特征进行识别和跟踪,具体的跟踪方法可分四类:基于区域的跟踪、基于物体轮廓的跟踪、基于特征的跟踪、基于模板的跟踪[17]。在MPEG-1、MPEG-2的标准下对运动物体进行跟踪,目前普遍采用的方法是解码I帧及P帧成普通的数字图像,并确定其需要跟踪的运动物体进行跟踪。而物体的形状、颜色、边缘等须通过学习的方法进行确定,由于形状随着物体的运动,可能会产生变形,这样对物体的各种将会出现的形状也需做出样本识别处理,同时颜色处于不同的光强度而不断变化,这些都给运动物体的跟踪带来巨大的困难。最简单的对运动物体进行跟踪的方法是采用相邻两帧相减的方法处理,该原理根据视频播放速度在25帧/S以上,在背景变化不大的情况下并且运动物体移动的相对位置很小,当采用相邻两帧相减时,背景能被相互消去,最终留下的显著区域即为运动物体所在的区域。缺点是该方法仅对背景变化不大且无其它运动物体与噪声干扰时处理较准确,这一理论已用在交通安全的监控中。对于一些特殊的物体比如整个目标都是恒定色,而背景中又无这种相近颜色的物体,设置一个模板进行滤波,把该物体的三种颜色相近的像素点留下,其余点滤去,同时再作平滑处理去噪声,则在图像显著的颜色区域即能找出运动物体。物体的运动是相对于背景的,背景的不断变动对运动物体的搜索会带来极大的困难。目前有人研究一种视频跟踪方法,即反向跟踪方法,运动背景存在一定的速度,把该速度求出,对连续帧进行平移处理反向变换出静态背景,这样运动物体就可以确定,这种方法的计算量大且背景非匀速运动时容易出现误差。也有把运动物体进行分块处理再跟踪,即物体由n个不同相近颜色块组成,它们相对的几何位置组成一个代码排序,可以采用几何位置编码进行代数识别,比如物体由A、B、C、D四块组成,A在B的左边,在C的上边,顺时针是ABDC等,该运动物体经旋转,变大、变小均不改变其编码顺序。其缺点是颜色随运动的变化会丢失目标。MPEG视频流由I(内帧)、P(预测帧)、B(双向预测帧)组成,为减少空间、时间的冗余,P帧的数据来自已经解压缩的I帧和P帧,B帧的数据来自已经解压缩的I帧和P帧或者P帧和P帧,这些需要解码的图像通过运动预测和(/或)补偿对P帧/B帧进行解码,P帧/B帧中每一个宏块的数据来自于最佳匹配的相应I帧和P帧或者P帧和P帧中,以及图像变化而必须的运动补偿。这就在视频显示系列帧中产生了数据相关性,帧中某一区域块(运动目标)由运动矢量相联系,根据这一特性,本文提出直接从MPEG数据流中寻找和跟踪运动物体的方法,充分利用压缩视频流的特点和内在数据相关性,提取每个块的运动补偿和运动矢量数据,并基于运动矢量的区域增长法寻找运动宏块,运动矢量的获得通过一个特定设置的统计滤波器,该滤波器主要应用于运动物体的边界宏块的运动矢量,运动轨迹由DCT变换的DC值和部分AC系数进行校正。该方法的优点在于充分利用压缩视频中帧与帧之间的数据相关性,跟踪时不用解码,能有效避开在不同光强度、背景变化较大、运动物体变形或被遮挡等传统物体跟踪方法不能解决的难点。该方法运算量小,实验结果较好。在体育比赛中精确测量广告牌出现的数量对组织者或广告商都是一件很费力的事情。到目前为止,对特定广告出现时间的统计需耗费大量的人力和时间。在一场比赛中对每一个广告的出现时间及过程对广告商和厂家都是非常有价值的,它能为该广告做出合理的定价。在本论文中我们根据跟踪理论提出描述一种对商业广告在体育电视中的检索、跟踪和统计的系统,该技术基于已有的体育场和商业广告的先验知识,利用快速Hough变换和文本区域的几何特征从体育电视图像中萃取广告信息,根据广告牌的颜色或几何特征及Harris特征点和块匹配等综合技术对广告牌进行跟踪。实验显示,我们的技术对广告牌出现的统计可知其精确度达90%以上。而在网球比赛中,记分牌的出现、比分的改变及广告的出现是非常重要的事件,我们提出一种能够检索记分牌和广告块出现以及比分内容改变的方法,选择两种方法来定义记分牌和广告区域的样本,第一种方法通过人工操作建立样本库,第二种方法通过样本自我学习的方式来建立一个样本库和一个潜在样本库。同样通过简单的快速Hough算法获取一些潜在几何区域,用对二值图像的块匹配方法对潜在的矩形区域进行识别并把它分类变成几种比分板和广告块。为了提高块匹配的精度,我们利用光学测量中所使用的数字散斑相关性对图像进行亚像素搜索进行数学理论的推导。根据相关函数近似于Gauss分布且具有单峰性这一特征,像素级的测量精度目前用逐点搜索法、十字搜索法、爬山法等。在工业测量中像素级的测量精度是远远不够,必须把测量精细到亚像素级。目前采用根据相关系数的单峰性近视满足Gauss分布的特征选取插值公式,直接对以最大相关系数为中心的相关系数矩阵进行插值,求出插值函数的最大值点并把它作为亚像素位移值,这种方法具有一定的抗噪能力及计算量小等优点。而梯度法是在连续的两幅变形前后的图像取相同的区域,通过直接建立的两个区域灰度差值与变形之间的关系式来求解位移场,该方法速度快,对微小变形来说效果较好。文献[83]提出基于微区统计相似特性的梯度法算法,该方法定义一个统计量并把该统计量的最小值或最大值作为亚像素位移。本文在数值理论的基础上提出数字散斑相关性在亚像素精度的一些问题,改进了十字搜索法、爬山法,从数学的角度推导出通过插值公式确定亚像素的位移值存在的问题,并比较几种计算亚像素方法的精度及稳定性,同时在离散状态下对这些方法的公式作了改进,在稳定性上能提高0.5%~20%,为今后合理有效地利用数字散斑相关性来进行工业测量打下基础。