论文部分内容阅读
视频跟踪是计算机视觉研究中的重要研究领域之一,视频跟踪技术可应用于视频监控、智能交通控制系统、车辆导航、无人驾驶、无人机、人机交互、智能机器人系统等方面。此外,视频跟踪技术也是三维重建、虚拟现实、增强现实等领域的基础。近年来,视频跟踪技术取得了重大进展,但仍面临许多难题,例如严重遮挡、形变、背景噪声、快速移动、目标旋转、运动模糊和对象低分辨率等因素都会严重影响跟踪的精度和鲁棒性。因此,如何实现鲁棒和长时的跟踪要求是值得研究的课题。本文完成的主要研究工作和成果总结如下:(1)针对复杂场景下目标丢失问题,提出了一种目标重定位跟踪算法。算法基于相关滤波技术为基础,采取重检测机制重定位跟踪失败的目标。算法首先设计更稳定的目标跟踪失败判定准则,然后使用支持向量机分类器对跟踪失败目标重定位,再使用被动攻击算法更新分类器。在视频跟踪标准数据集OTB50上的实验结果表明,算法提高了复杂场景下目标跟踪的准确率。(2)针对传统方法提取的特征信息不丰富以及鲁棒性不强的问题,提出了一种利用深度学习卷积神经网络特征结合重检测机制的相关滤波目标跟踪算法。算法利用深度学习模型提取的特征具有较好的泛化能力特点,使用具有语义特征信息的高层特征,同时使用低层手工设计的Hog特征减少计算量,构造出同时具有高层和低层的外观模型。针对跟踪失败的目标,使用重检测机制重定位丢失的目标以便获得长时、鲁棒的跟踪结果。(3)针对相关滤波固有的边界效应问题以及目标响应值不变的假定,提出联合解决以上问题。此外,考虑时间一致性因素对跟踪性能的影响,构造出更鲁棒的外观模型,提高复杂场景下目标跟踪的鲁棒性和准确性。算法使用ADMM算法可快速求解出一个全局最优解。实验结果表明,本章的算法可以更好的处理复杂场景下目标跟踪问题。(4)针对空间正则化方法会减少跟踪目标的外观信息以及目标上下文对跟踪性能的影响,提出了一种结合目标当前帧的上下文信息以及历史目标帧外观信息的模型。为获得目标更多的外观模型,算法不仅考虑了当前帧的全局上下文信息,还考虑了历史目标外观信息即时间相关方法对跟踪性能的影响。通过构建更全面的目标外观模型信息,提高了在复杂场景下的跟踪性能。此外,为了获得快速的计算和全局最优解,使用ADMM算法求解。仿真结果表明,本章的算法可以有效提高被改进算法的性能。算法可提高复杂场景下目标跟踪的准确率。(5)针对单尺度块跟踪性能不稳定问题,提出多尺度块稀疏表示直方图目标跟踪算法。为解决复杂场景下的鲁棒跟踪问题,借鉴稀疏表示理论,提出多尺度块稀疏表示的思想来解决单尺度块稀疏表示导致的跟踪性能不稳定以及目标信息获取不充分问题。此外,为了解决模型漂移导致的跟踪失败,遮挡处理方法被提出来。通过上述改进方法可以获得鲁棒的目标跟踪性能。