序列图像稀疏表示与目标跟踪研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:ccxdnk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
序列图像为在不同时间、不同方位对目标连续获取的系列图像,广泛存在于视频监控、辅助驾驶、人机交互、军事导航、导弹打击等社会和军事层面。对于图像的有效表示是众多计算机视觉应用(如图像识别、目标跟踪、行为识别等)的基础问题。由于在序列图像中可能出现遮挡、光照变化、形变、背景杂乱等一系列不可预测的变化,对于序列图像中目标的准确表示是一个极富挑战性的研究课题。  稀疏表示理论是最有效的图像表示方法之一。该理论起源于哺乳动物视觉皮层对自然图像刺激的稀疏响应,在人脸识别、目标跟踪、图像去噪、畸变校正等众多领域获得了广泛的应用。本论文针对单个图像样本的稀疏特性,构建了双层次稀疏表示模型,从全局轮廓和局部细节两个层次挖掘稀疏特征以获得更加完备的图像表示;针对多个图像样本中目标物体的组稀疏特性,构建了加权多任务稀疏表示模型,引入的自适应加权机制使得表示模型更具判别性;针对序列图像数据中物体外观的变化特点,构建了序列图像时域与低秩性约束表示模型,有效抵抗序列图像中目标外观的突变干扰。以上三种稀疏表示模型应用于目标跟踪任务,在标准数据集上与当前一些主流的跟踪算法对比,跟踪准确率和鲁棒性均获得了显著提升。  本文的主要工作与创新点如下:  提出了图像双层次稀疏跟踪算法。针对单幅图像表示问题,通过双层次表示模型挖掘其更加完备的稀疏特性,同时结合判别式模型和生成式模型的优点,既能够充分利用背景信息,又能在训练样本较少时保持稳定性能。算法中全局表示字典与分类器进行耦合学习使得模型能够自适应于跟踪过程中场景的变化。通过在15个标准数据集上与10个主流算法进行对比,结果表明本算法在跟踪的平均中心误差和成功率两个指标上均获得了最优的结果,而且能够有效地克服漂移问题。  提出了加权多任务逆向稀疏跟踪算法。针对多个正样本之间存在的组稀疏特性和负样本图像的稀疏特性,将正负样本表示为候选样本的线性组合,构建了统一的多任务稀疏表示模型,并且引入加权机制对正负样本和候选样本之间的关系进行差异化惩罚以提高表示模型的判别性能。相较于传统的多任务稀疏跟踪算法MTT(multi-task tracker),本算法对单帧图像的平均执行时间缩短了42%,平均成功跟踪率提高了46%。与12个当前主流跟踪算法进行对比,本算法在平均性能指标上取得了最优效果。  提出序列图像时域与低秩性约束跟踪算法。针对序列图像中目标外观的变化特点构造表示模型,通过核范数正则化序列目标样本中的低秩结构,同时利用l1,2混合范数合理地对相邻帧中目标样本的差异进行约束。在获得表示模型的编码矩阵后,本算法构建加权编码图以实现更加鲁棒的目标跟踪。实验表明本算法的表示模型能够有效地对序列目标外观中不可预测的突变进行建模。与12个当前主流算法的对比中,本算法在26个标准数据集上取得了最优跟踪结果,在平均中心位置误差和平均跟踪成功率指标上比次优算法分别提高了69%和24%。
其他文献
随着电力市场的逐步建立,供电质量变得日益重要,而供电质量的好坏通常要通过配电变压器的运行状态进行实时监控,因此配变监控水平也是衡量配电自动化水平的一个主要标准之一。随
本文以DOP企业酯化反应装置的苯酐转化率为研究背景,对神经网络的软测量建模方法及其在装置中的实施方案进行了研究。 文章在分析了传统BP神经网络基础上,提出了改进BP算法,
随着国民经济的发展,铁路运输起着越来越重要的作用。作为车辆重要部件的轮对在铁路安全运输中占据重要的地位。传统的轮对检测方法靠人工进行,其效率低,差错率高。目前,我们国家
随着计算机技术的发展,传统的人机交互技术已难以适应越来越复杂多样的需求。用户要求更加自然和智能的交互方法,包括声音、视觉和智能传感器等等。其中基于计算机视觉的方法具
学位
学位
近年来,深度神经网络取代传统的高斯混合模型,在连续语音识别领域已经取得了巨大成功,而传统的说话人识别建模方法仍以产生式模型为主导。不同于语音识别问题可以事先确定其音子
本文是在对故障诊断方法与振动监测系统的开发现状进行广泛调研和深入分析的基础上,针对火电厂大型旋转机械运行状态的特点,进行了故障诊断新方法的应用研究并开发了旋转机械
随着计算机软硬件及网络技术的发展和 Internet 的广泛应用,信息技术已经普遍地运用于各行各业,并为各行各业的发展,正在做出着不可磨灭的贡献。但与此同时,信息系统的安全性
人机交互技术是人类与计算机进行交流所必须的技术,更是智能娱乐机器人的关键和基础。随着计算机逐步应用到社会生活的各个方面,让人与计算机之间的交互更为方便、自然和有效日