基于像素级概率模型的视觉目标跟踪方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:c224224224
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视觉目标跟踪是视频内容分析与理解的基础,在安防、军事、人机交互、智能设备等领域具有广泛的应用。提高跟踪算法的准确率与鲁棒性,能够为各领域发展提供必要的技术支撑,具有重要的研究意义与实用价值。尽管近年来已取得了显著的进展,在线目标跟踪的研究目前仍面临目标形变、复杂运动、背景噪声干扰等挑战性因素的困扰。当前最先进方法使用的目标表征方式侧重于全局目标结构的建模,适用于跟踪形状结构稳定的刚性物体,而对于目标形变明显的情况,该类模型适应目标形变的能力受到严格的全局性几何约束的限制,在建模目标运动与表观变化规律方面存在固有的局限性,难以获得稳定准确的跟踪效果。针对上述问题,本文着手于研究更为普适的目标表征模型以及相应的跟踪方法,重点处理多重因素引起的目标形变以及带来的表观建模难题。本文主要工作如下:
  在目标表征方面,提出了一种能够有效表征可形变物体的像素级目标概率模型。首先,将跟踪问题形式化为一个像素级最大后验估计问题,联合考虑像素层面的时域一致性约束与表观模型。提出基于像素匹配的时域一致性模型,根据光流校验误差定义概率转移函数,以估计不同帧之间的一致性信息,集成利用历史估计结果。该模型能够减小单帧表观模型误差产生的影响,使得方法具有较好的普适性。进一步提出了从像素级概率高效生成传统模型判别分数的方法,从而产生了一种多表征融合跟踪框架,使得基于传统模型的算法能够集成像素级判别信息。实验表明,所提出的方法在跟踪高度可形变物体方面优于最新方法,并且多表征模型在通用物体跟踪任务中显著提升了传统方法的总体性能。
  针对平台与目标复杂运动耦合带来的目标形状与表观变化问题,提出基于目标–背景运动关联建模的像素级概率推断方法。首先,从成像角度分析运动与图像观测的关系,减小运动估计的参数空间来保证方法的实时性;其次,提出先局部后全局的光流估计方法,获得保留物体边缘的目标邻域光流场;进一步,在贝叶斯理论框架下,引入像素空间隐变量表示像素点属于目标的概率,引入运动参数空间隐变量来表示目标与相机运动状态,将跟踪任务建模为交替估计这些隐变量的过程。在时域上,分别考虑其当前状态估计与历史估计结果的关系,利用时域上的一致性约束来保证状态分布预测的可靠性,从而实现问题的迭代求解,实现运动参数解耦并获得准确的像素级目标概率估计。实验表明,提出的模型显著提高了算法对成像平台与目标复杂运动的鲁棒性。
  为处理目标形变引起的表观模型受背景区域干扰的问题,将目标邻域的显著性估计问题引入到视觉跟踪任务中,进行两个问题的联合建模。一方面,根据跟踪场景中存在历史信息的特点,提出一种新颖的时空显著性计算方法,在时间域上建立基于光流法的显著性转移模型,在空间域上建立基于背景距离与在线学习的像素级判别模型,集成时空观测进行联合推理。另一方面,引入显著性作为可靠性权重来描述目标表征模型中视觉特征的重要性,使得算法的目标表征更为精确,能够有效抑制复杂背景噪声对模型的干扰,对目标形变因素的鲁棒性得到提升。实验表明,该方法对于存在多重因素干扰的长时间跟踪任务具有突出的可靠性。
其他文献
作为推动导弹技术发展的关键核心技术,制导与控制系统直接关系着导弹的性能。随着导弹技术的不断升级、对导弹性能要求的不断提高,导致对制导控制系统的性能提出了更高的要求。制导与控制一体化设计方法能够充分利用制导系统和控制系统之间的耦合关系、提高整体系统的性能和可靠性、并降低成本,因此受到了越来越多的关注。在实际的导弹制导与控制系统设计的过程中,为了提高战斗部的毁伤效果、避免弹体结构损伤、“失速”等现象的
欠驱动机器人的驱动源数目少于自由度数目,因而具有结构紧凑、质量轻、能耗低、可靠性高、环境适应能力强等方面的优点,在深空探测、深海探测、交通运输、仿生机器人等领域获得了广泛应用。一种基于绳索驱动平行四边形桁架机构的新型欠驱动机械臂在这种背景下应运而生,称为欠驱动绳索桁架式机械臂,新颖且巧妙的桁架机构的设计使其具有可折叠、可扩展、具有形状自适应包络抓取能力等优点,非常适合作为大型空间展开臂用于深空探测
时滞现象广泛存在于各类系统中,如机械传动系统、化工过程系统、工业冶金系统、航空航天系统和网络化控制系统等。一方面,时滞的存在可能会导致系统性能变差甚至不稳定,另一方面,巧妙地利用时滞又可以获得某些意想不到的性能,因此时滞问题近年来得到了广泛的关注和研究。Smith预估控制器作为一种经典的时滞补偿方法,能够有效地补偿系统输入时滞,但是其无法应用于原系统非时滞部分不稳定的情形。预估反馈控制器则有效地解
学位
步态识别作为计算机视觉和生物特征识别领域的一个热点研究课题,它旨在赋予计算机能够根据人体行走的姿势辨别出人物身份的能力。该研究具有重要的理论研究意义和巨大的实际应用价值,涉及了计算机视觉、模式识别、视频/图像处理、图形学和智能人机交互等多个学科,并且在远距离身份识别方面具有巨大的应用前景。例如,目前在银行、地铁、机场、火车站等安全敏感场所的视频监控系统中就急需一种准确的、鲁棒的远距离身份识别技术。
在卫星激光通信系统中快速倾斜镜起着至关重要作用,其作为光路调整单元,通过不断地偏转运动,来调整光束角度,从而实现链路的畅通。由于星-地或星-星之间通信距离较远,正所谓‘差之毫厘谬之千里’,快速倾斜镜要想实现精密运动,其执行机构是关键所在。压电陶瓷执行器具有响应速度快、分辨率高、体积小、不发热以及无摩擦等优点是一个理想执行机构。由于压电陶瓷材料自身存在固有的非线性迟滞、蠕变特性。这些特性会造成系统的
相较于状态空间系统,广义系统结构更加复杂,而且能够更好的表述一些实际系统,因此,对于广义系统的研究具有很强的理论和现实意义。现有的研究成果主要集中在广义系统的控制问题上,而对于广义系统故障诊断问题的研究还不够深入。因此,本文基于滤波方法,针对一类广义系统的故障诊断问题进行了研究。论文的主要工作及成果可归纳为如下内容:  首先,研究了基于鲁棒观测器的一类广义系统故障诊断问题。针对一类线性的广义系统,
学位
在大雾环境下,由高速公路监测系统拍摄获取的图像对比度低,图像中的目标模糊,这对于行驶车辆的监测造成了一定的难度,因此使得图像去雾方法在高速公路的监测中具有很重要的意义。图像去雾的目的在于提高图像的对比度和将图像中的目标变得清晰,有利于监测系统能准确的提取到行驶车辆的重要信息,主要包括车型和车牌号等细节信息。因此图像去雾算法是目前很多学者研究的重要方向。  图像去雾模型迄今主要分为两大类模型:雾化图
学位
本文主要针对结构噪声:数学上非独立同分布、视觉上具有特定结构模式的噪声,譬如自然图像中雨条、遥感图像中条带、医学图像中伪影等。结构噪声图像复原目的在于从包含结构噪声的图像中恢复出损坏或丢失信息,获得清晰图像的真实面貌。结构噪声由于其相邻像素结构相关、几何形态变化大、统计分布复杂的特点,使得其建模表达与抑制困难。现有方法大多局限于常见的随机噪声,结构噪声图像复原方法研究较少且不系统。本文针对任意角度
学位
高精度加速度计是卫星重力测量和空间引力波探测等的核心技术,基于电容传感和静电控制的静电加速度计具有六自由度同步测量、高精度等优点,已被成功应用于多颗重力测量和空间引力实验等卫星项目。空间静电加速度计以往都采用传统PID控制。为了提升空间静电加速度计的抗干扰能力、自适应性、可扩展性等性能,针对传统PID控制中多自由度耦合、非线性效应、超调振荡、如何优化带宽和低频特性等问题,本文将嵌入模型控制策略引入
随着电网智能化的研究和建设受到广泛的关注与重视,越来越多的人力和物力投入到智能电网的建设中来。分布式发电的高渗透接入,对用电负荷的调峰起到了积极作用,同时其作为备用电能也提高了电网弹性。各类智能量测设备如相量测量单元(Phasor Measurement Unit, PMU)和智能电表等的广泛引入,为智能电网提供了更丰富的量测信息,更利于实时地掌握电网运行状态。然而,智能电网发展带来机遇的同时也提
学位