论文部分内容阅读
视频目标跟踪是计算机视觉的核心技术之一,它融合了图像处理、自动控制和人工智能等众多领域,其在视频监控、医疗诊断、生物学研究、人机交互、自动驾驶及机器人等领域具有重要的科学理论意义和工程应用价值。本文以Mean Shift (MS)作为目标跟踪的核心算法,以提高目标跟踪的准确性、鲁棒性和适应性为目标,旨在解决视频目标跟踪中部分遮挡、形变、光照变化、尺度变化和跟踪矩形可调整姿态等问题。传统颜色直方图的MS算法只考虑了目标颜色的统计信息,不包含目标的空间信息,当目标颜色与背景颜色相近时,容易导致不准确跟踪或跟踪丢失。针对该问题,提出了一种自适应空间颜色直方图的MS跟踪算法。该算法根据目标对象的最新外接矩形尺寸,确定对象分块方法,根据各块的Bhattacharyya系数值,确定各块的权重系数。其中,自适应分块的颜色直方图包含了自适应分块方法和目标的空间信息;加权Bhattacharyya系数考虑到不同块对整体相似度的不同影响。研究表明,提出的算法可以动态地调整跟踪矩形水平和垂直方向的尺度,自适应地确定对象的分块方法,在部分遮挡和形变等情况下,比传统的MS算法和固定分块的MS算法具有更好的跟踪性能。考虑到传统MS算法易受光照变化、部分遮挡、图像模糊等因素的影响,引入了图像局部特征点。采用实验对比的方法从旋转不变性、尺度不变性、光照不变性、抗模糊性、跟踪精度及提取时间等六个方面,对目前最流行的六个特征点算法及描述子(BRIEF、LAZY、ORB、RIFF、SIFT和SURF)等进行比较,最终确定了SIFT作为本文采用的特征点及描述子。针对传统MS算法易受光照变化、部分遮挡和图像模糊等因素影响的问题,提出了一种融合改进MS和SIFT的跟踪算法,该方法由改进的MS跟踪算法(初定位)和SIFT特征提取、匹配和跟踪(SIFT跟踪)组成。前者即第三章算法,后者在前者跟踪结果的基础上,采用SIFT跟踪方法得到SIFT跟踪结果。最后,通过线性加权的方法融合改进MS和SIFT的跟踪结果,获得最终的跟踪结果。研究表明,提出的算法进一步地解决了部分遮挡、光照变化和图像模糊情况下的目标跟踪问题。为了解决目标对象跟踪矩形可自适应调整姿态的问题,提出了一种融合MS和SIFT的仿射变换目标跟踪算法。将仿射变换引入到目标的候选模型中,将复杂运动跟踪问题转化为代价函数的优化问题。通过对代价函数求各仿射参数的偏导数并令其为零,求出仿射变换参数,得到MS仿射变换跟踪结果。通过SIFT对目标区和MS跟踪区进行SIFT特征提取、匹配和仿射变换参数计算,得到SIFT仿射变换跟踪结果。最终,采用线性加权的方法融合MS和SIFT跟踪结果,获得最终的跟踪结果。研究表明,提出的算法有效地解决了跟踪矩形可自适应调整姿态的问题。