视频中对运动物体的寻找、跟踪及块匹配算法

被引量 : 4次 | 上传用户:z5748259
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
运动目标的跟踪是视频处理的热点,随着视频压缩技术的逐渐普及,压缩视频格式目前已应用到科学研究、工农业生产、军事、公安、医疗卫生、教育等许多领域。在压缩视频中对运动物体跟踪成为新的研究方向,而新的研究方法必须根据压缩视频原理相应建立并充分利用压缩视频数据流中帧与帧的数据相关性,以流码的形式找出运动物体的数据流轨迹。传统的目标跟踪常常在非压缩视频格式中,通过目标的颜色、几何形状的特征进行识别和跟踪,具体的跟踪方法可分四类:基于区域的跟踪、基于物体轮廓的跟踪、基于特征的跟踪、基于模板的跟踪[17]。在MPEG-1、MPEG-2的标准下对运动物体进行跟踪,目前普遍采用的方法是解码I帧及P帧成普通的数字图像,并确定其需要跟踪的运动物体进行跟踪。而物体的形状、颜色、边缘等须通过学习的方法进行确定,由于形状随着物体的运动,可能会产生变形,这样对物体的各种将会出现的形状也需做出样本识别处理,同时颜色处于不同的光强度而不断变化,这些都给运动物体的跟踪带来巨大的困难。最简单的对运动物体进行跟踪的方法是采用相邻两帧相减的方法处理,该原理根据视频播放速度在25帧/S以上,在背景变化不大的情况下并且运动物体移动的相对位置很小,当采用相邻两帧相减时,背景能被相互消去,最终留下的显著区域即为运动物体所在的区域。缺点是该方法仅对背景变化不大且无其它运动物体与噪声干扰时处理较准确,这一理论已用在交通安全的监控中。对于一些特殊的物体比如整个目标都是恒定色,而背景中又无这种相近颜色的物体,设置一个模板进行滤波,把该物体的三种颜色相近的像素点留下,其余点滤去,同时再作平滑处理去噪声,则在图像显著的颜色区域即能找出运动物体。物体的运动是相对于背景的,背景的不断变动对运动物体的搜索会带来极大的困难。目前有人研究一种视频跟踪方法,即反向跟踪方法,运动背景存在一定的速度,把该速度求出,对连续帧进行平移处理反向变换出静态背景,这样运动物体就可以确定,这种方法的计算量大且背景非匀速运动时容易出现误差。也有把运动物体进行分块处理再跟踪,即物体由n个不同相近颜色块组成,它们相对的几何位置组成一个代码排序,可以采用几何位置编码进行代数识别,比如物体由A、B、C、D四块组成,A在B的左边,在C的上边,顺时针是ABDC等,该运动物体经旋转,变大、变小均不改变其编码顺序。其缺点是颜色随运动的变化会丢失目标。MPEG视频流由I(内帧)、P(预测帧)、B(双向预测帧)组成,为减少空间、时间的冗余,P帧的数据来自已经解压缩的I帧和P帧,B帧的数据来自已经解压缩的I帧和P帧或者P帧和P帧,这些需要解码的图像通过运动预测和(/或)补偿对P帧/B帧进行解码,P帧/B帧中每一个宏块的数据来自于最佳匹配的相应I帧和P帧或者P帧和P帧中,以及图像变化而必须的运动补偿。这就在视频显示系列帧中产生了数据相关性,帧中某一区域块(运动目标)由运动矢量相联系,根据这一特性,本文提出直接从MPEG数据流中寻找和跟踪运动物体的方法,充分利用压缩视频流的特点和内在数据相关性,提取每个块的运动补偿和运动矢量数据,并基于运动矢量的区域增长法寻找运动宏块,运动矢量的获得通过一个特定设置的统计滤波器,该滤波器主要应用于运动物体的边界宏块的运动矢量,运动轨迹由DCT变换的DC值和部分AC系数进行校正。该方法的优点在于充分利用压缩视频中帧与帧之间的数据相关性,跟踪时不用解码,能有效避开在不同光强度、背景变化较大、运动物体变形或被遮挡等传统物体跟踪方法不能解决的难点。该方法运算量小,实验结果较好。在体育比赛中精确测量广告牌出现的数量对组织者或广告商都是一件很费力的事情。到目前为止,对特定广告出现时间的统计需耗费大量的人力和时间。在一场比赛中对每一个广告的出现时间及过程对广告商和厂家都是非常有价值的,它能为该广告做出合理的定价。在本论文中我们根据跟踪理论提出描述一种对商业广告在体育电视中的检索、跟踪和统计的系统,该技术基于已有的体育场和商业广告的先验知识,利用快速Hough变换和文本区域的几何特征从体育电视图像中萃取广告信息,根据广告牌的颜色或几何特征及Harris特征点和块匹配等综合技术对广告牌进行跟踪。实验显示,我们的技术对广告牌出现的统计可知其精确度达90%以上。而在网球比赛中,记分牌的出现、比分的改变及广告的出现是非常重要的事件,我们提出一种能够检索记分牌和广告块出现以及比分内容改变的方法,选择两种方法来定义记分牌和广告区域的样本,第一种方法通过人工操作建立样本库,第二种方法通过样本自我学习的方式来建立一个样本库和一个潜在样本库。同样通过简单的快速Hough算法获取一些潜在几何区域,用对二值图像的块匹配方法对潜在的矩形区域进行识别并把它分类变成几种比分板和广告块。为了提高块匹配的精度,我们利用光学测量中所使用的数字散斑相关性对图像进行亚像素搜索进行数学理论的推导。根据相关函数近似于Gauss分布且具有单峰性这一特征,像素级的测量精度目前用逐点搜索法、十字搜索法、爬山法等。在工业测量中像素级的测量精度是远远不够,必须把测量精细到亚像素级。目前采用根据相关系数的单峰性近视满足Gauss分布的特征选取插值公式,直接对以最大相关系数为中心的相关系数矩阵进行插值,求出插值函数的最大值点并把它作为亚像素位移值,这种方法具有一定的抗噪能力及计算量小等优点。而梯度法是在连续的两幅变形前后的图像取相同的区域,通过直接建立的两个区域灰度差值与变形之间的关系式来求解位移场,该方法速度快,对微小变形来说效果较好。文献[83]提出基于微区统计相似特性的梯度法算法,该方法定义一个统计量并把该统计量的最小值或最大值作为亚像素位移。本文在数值理论的基础上提出数字散斑相关性在亚像素精度的一些问题,改进了十字搜索法、爬山法,从数学的角度推导出通过插值公式确定亚像素的位移值存在的问题,并比较几种计算亚像素方法的精度及稳定性,同时在离散状态下对这些方法的公式作了改进,在稳定性上能提高0.5%~20%,为今后合理有效地利用数字散斑相关性来进行工业测量打下基础。
其他文献
区域土地利用变化及其驱动力的研究,尤其是关系着人类赖以生存的物质基础的区域耕地利用变化,其动态变化特征与驱动机制的研究已成为全球LUCC研究的重要内容,它对于掌握土地利用
国家观是西塞罗政治思想的核心,是西塞罗对当时罗马国家状况的理解,也是他对理想国家的设想。研究西塞罗的国家观,一方面可以加深对西塞罗的了解,另一方面,也是考察罗马共和国末期
<正>实施素质教育,是提高民族素质、实现现代化的需要,是当前我国基础教育改革与发展的方向。小学数学是一门基础学科,如何在小学数学教学中全面贯彻落实素质教育,发挥其整体
会议
本文以工业废水排放量作为度量环境污染程度的指标,利用我国30个省份1992~2007年的年度数据,采用动态面板数据模型,实证分析了外商直接投资对我国环境的影响及其区域差异,结果
由对变态人格特征与犯罪的共性分析,逐渐转向对特殊群体的分析,这是心理学界与法学界研究的必然趋势。截取高校学生小群体这一断面,对变态人格者犯罪的特征、犯罪的归类进行
理论背景:成人股骨头缺血性坏死是临床常见的一种疾病。成人股骨头缺血性坏死虽不至于威胁患者的生命安全,但严重影响着患者的身体健康和生活质量。病变可累及整个髋关节,导致关
背景和目的冠状动脉性心脏病(coronary heart disease,CHD,冠心病)己成为当代世界危及人类健康的主要病因及死因。目前研究认为,高脂血症、高血压、吸烟、糖尿病及心血管疾病家
本论文在体外细胞毒性检测SRB法的指导下对异叶败酱甲醇提取物的石油醚,氯仿,乙酸乙酯和正丁醇萃取物分别进行了抗肿瘤活性成分的跟踪分离筛选。实验结果表明,氯仿萃取物对人
目的:探讨脑出血后遗症的护理方法及其效果。方法:将2008年7月~2012年7月入住我院的100例脑出血后遗症患者按照抽签法随机分为对照组与观察组,各为50例。对照组给予常规护理,
乳清蛋白的一个重要功能特性是可以形成热/压诱导的凝胶能够稳定大量的水和其它食品成分。凝胶的形成是分子间电荷吸引力和排斥力相平衡的结果。这一平衡主要依赖于蛋白浓度