基于相关滤波的在线视觉跟踪研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:zkw_2209
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为计算机视觉领域极具挑战的一项关键技术,视觉跟踪在视频监控、导航、军事、人机交互、虚拟现实、智能机器人、自动驾驶等多个领域都有着广泛的应用。其中,相比于基于特定目标检测(例如人、车辆等)的模型固定式视觉跟踪方法,一种被称为模型非固定式在线视觉跟踪方法在学术与工业领域更受关注。该类跟踪方法在仅有待跟踪目标的初始位置标注信息的情况下,仍能通过在线自适应的对目标表观进行灵活而鲁棒的建模,实现对任意目标的准确跟踪。随着该类模型非固定式在线视觉跟踪方法的广泛应用,它面临的挑战也愈来愈严峻。跟踪场景中面临光照变化、目标姿态多样、尺度缩放、运动模糊、遮挡和消失等多种不确定因素,准确、鲁棒、高效的跟踪算法设计仍然是极具挑战的研究课题。  基于相关滤波的视觉跟踪算法凭借兼顾准确性和速度的优势,吸引了大量研究者的关注。本文深入研究了基于相关滤波的视觉跟踪算法,针对跟踪目标在尺度、长宽比、旋转方面的姿态变化、剧烈运动、遮挡等问题,提出了在特征学习、运动模型设计、表观模型增强以及跟踪推断策略设计四个方面对基于相关滤波的视觉跟踪算法进行优化改进,保证了算法的准确性、鲁棒性以及实时性。主要的工作和贡献概括如下:  提出了基于联合尺度位移空间、旋转空间、时域的综合性相关分析的视觉跟踪算法。具体来说:该跟踪算法在表观建模和跟踪推断策略两方面进行优化。表观建模方面,通过引入块循环矩阵、对数极坐标变换、离散傅里叶变换,对联合尺度位移空间、旋转角度空间内目标表观的相关关系进行细粒度的建模,从而能够提高尺度和角度估计的准确性。在跟踪推断策略方面,通过时域的相关分析以及高阶马尔可夫链模型建模,能够在表观模型中保留目标表观的鲁棒性、多模态性以及有效性,解决冗余表观导致的表观分布不均问题、背景噪声干扰问题,并根据当前候选目标与保留的目标表观的时域相关性来鲁棒而自适应地推断目标的状态。我们在多个视觉跟踪标准评测库上验证了这些创新点的有效性,并大幅度提高了跟踪算法的准确性和鲁棒性。  提出了基于引入高层语义以及自顶向下推断的相关滤波的视觉跟踪算法。该算法主要在运动模型方面对传统基于相关滤波的跟踪算法进行优化。首先,我们从传统基于相关滤波的在线视觉跟踪算法鲁棒性不足问题出发,将高层类别相关的语义信息引入在线视觉跟踪中。在目标类别的弱监督作用下,在语义层面对目标进行全局粗定位,优化目标的运动模型,弥补传统基于相关滤波的目标跟踪算法对目标表观表示能力不足、侧重于局部细粒度建模、目标搜索范围有限的缺点,从而实现鲁棒的跟踪。由于视觉跟踪并不提供目标的类别语义标签,我们通过使用在大规模数据集上训练得到的通用卷积神经网络分类器来确定目标的类别分布并进行类别迁移,从而获得跟踪目标的类别语义信息。我们在目前流行的视觉跟踪评测库上进行了算法的对比实验、成分分析实验以及定性评估实验,从而验证算法改进的有效性。  提出了基于空间对齐的相关滤波网络的视觉跟踪算法。该算法主要在运动模型、特征学习两个方面对传统基于相关滤波的跟踪算法进行优化。首先,将相关滤波操作转变为可导的相关滤波层引入卷积神经网络中,从而在大规模视频库上离线学习适用于基于相关滤波的目标跟踪的深度特征,增强表观模型的目标表示能力以及判别能力。其次,引入空间对齐网络对目标在连续帧内的运动变换参数进行估计,解决相关滤波的边缘效应问题以及固定目标长宽比建模问题,从而准确地估计目标的大幅度偏移以及长宽比变化。通过端到端的离线网络训练,实现空间对齐网络模块与相关滤波模块的互补学习,增强该网络的跟踪性能。在线跟踪时,仅通过网络的一次前向传播,实现目标的实时跟踪。我们同样在多个视觉跟踪评测库上验证了算法的有效性,并在鲁棒性以及实时性上取得了较好的结果。  基于上述方法和创新,我们的跟踪算法在多个跟踪评测库上都取得了当时最好或者领先的评测结果。同时,上述方法和创新,对于其他计算机视觉问题和应用,例如视频分割、视频姿态估计等,也有一定的借鉴意义。
其他文献
我国原铝产量位居世界第一,但是铝电解关键技术和基础理论研究薄弱,导致我国铝电解工业资源消耗高、能源利用率低、三废排放大。我国的铝电解槽寿命只有4到6年,比国外平均寿命少
将外部设备连接到计算机上时,USB(Universal Serial Bus)接口是优先的选择.不管是使用外围设备的用户,或是开发USB软硬件的设计者,USB都有让双方满意的特性.从客户端的观点来
该课题从工程实际出发,对基于电磁加热技术和软开关技术的电磁炉控制系统设计和应用进行了研究,旨在为国内的电磁炉及其它应用电磁加热系统的家电设计探讨一种新的思考及实践
产生于中枢神经系统的脑电信号包含丰富的情感生理信息,非常适于情感识别方面的研究。近年来,伴随着信号处理和机器学习技术的快速发展,基于脑电信号的情感识别正在成为模式识别
在靶场试验中,飞行目标的三维姿态参数是反映目标飞行状态的重要指标,对武器系统的研制、开发都具有十分重要的意义.目前,靶场对空中飞行目标的姿态测量,主要还是采用遥测或
如何有效地去除人脸图像中的几何、光照变化进而合成标准光照下的正面人脸图像,是人脸识别研究中一个亟待解决的问题。本文针对该问题展开了系统性的研究,提出了多种基于深度神
鉴于虚拟仪器在自动测试领域的飞速发展,该文提出并构建了基于USB总线的虚拟仪器测试平台的总体设计思想,结合虚拟仪器技术和USB总线技术,在Visual Basic语言编程环境下开发
该文详细介绍了虚拟仪器通用硬件平台的开发过程.它既是一个虚拟测试仪器的硬件平台,也是一个计算机外设,它和计算机一起组成一个功能强大的信号测试系统.它采用模块化的主从
科学技术和人工智能的不断发展,促进自动控制向智能控制方向发展,作为一种新的控制技术,智能控制已在越来越多的控制领域中得到了广泛的应用.该文详细地分析了智能控制中的神
热成像技术能够探测不可见的长波红外辐射并以图像的形式显示,在科学研究、安防刑侦及国防军事中有着举足轻重的地位。如果可以用全景图的方式显示所观测场景的大视场热成像则