基于特征学习和模型集成的目标跟踪

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:gsfv85
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标跟踪技术是计算机视觉的一个经典问题。它是视频内容结构化过程中连接目标检测与高层行为语义的重要桥梁,同时也为高级人工智能所需要的环境感知和行为决策控制提供了重要依据。因此,目标跟踪在智能监控、人机交互、无人驾驶等现实场景中有着广泛的应用。  目标跟踪系统包括目标初始化、表观建模、运动估计和目标定位四个模块。由于感兴趣的目标表观描述常常会受到各种因素(譬如光照变化、严重遮挡、形变、剧烈运动、复杂背景等)的干扰,使得在线目标跟踪变得非常具有挑战性。围绕着跟踪系统各模块面临的主要问题,本文在目标表观视觉表达、多部件统计建模、先验知识启发的检测器与跟踪器模型协同学习和在线聚类分析辅助决策等方面进行了研究,并分别提出了相应的模型和算法,有效地提高了跟踪性能。本文的主要研究工作和贡献概括如下:  基于特征蒸馏的目标跟踪。针对当前深度卷积网络提取特征速度慢与目标跟踪需要较高实时性这两者之间的矛盾,本文提出了一种融合模型压缩、特征学习和尺度预测的跟踪方法。在模型压缩的过程中,一种基于教师-学生范式的方法用来作为指导准则,即用大网络监督小网络的拟合训练,从而在测试阶段就可以用小网络快速拟合大网络的中间层特征作为输出特征表达,然后嵌入到相关滤波框架进行目标跟踪。小网络模块也引入了移位-拼接结构对特征提取过程进行加速。另外增加的尺度预测模块进一步提高了跟踪性能。在公共目标跟踪数据集OTB50和OTB100上的实验结果表明,该方法与当前最好的深度网络跟踪算法相比,性能略有下降,但速度却提升了5倍以上。  基于加权部件上下文学习的目标跟踪。为了有效地挖掘目标跟踪过程中上下文结构关系,本文提出了基于样例-支持向量机选择具有代表性的部件,然后对这些部件构建部件上下文结构学习框架,进而通过结构支持向量机对其进行优化学习。在上下文结构关系建模中主要融合了时空关系的多层次外观表达、先验知识和运动一致性,克服了传统方法在视觉目标表观建模方面的不足。这里,该模型一方面利用了特征、部件和目标等不同层级间的关联信息;另一方面引入层级化上下文图模型结构,挖掘了目标和部件在跟踪过程中的隐含关系,包括其内部或上下文区域各部件所起的作用。实验结果表明上下文结构关系对跟踪器的性能有较大提升,并与其他最好的方法相比在成功率上提升了四个百分点。  基于模型协同的目标跟踪。为了解决相关滤波跟踪器在跟踪过程中由于长时间遮挡或消失-再现所引起的漂移问题,本文设计了融合梯度和颜色信息的MC-HOG特征,并基于随机采样生成的在线检测滤波器对整个图像搜索区域进行快速再检测,用检测到的少量相对可靠候选目标区域来增强目标跟踪器对漂移的鲁棒能力。实验结果表明该方法与其他跟踪器相比,性能提升了五个百分点。  基于在线聚类的目标跟踪。为了解决在目标跟踪过程中存在的决策模糊问题,本文将在线聚类和模型融合引入目标跟踪系统。在线聚类挖掘观测模型的参数空间和历史目标表观特征空间的潜在群组结构,并通过融合多个弱假设得到一个强分类器预测感兴趣的目标状态。在公共数据集上的实验充分说明了该算法的先进性和有效性。
其他文献
锌钡白干燥煅烧过程是锌钡白生产最为关键一道工序,原锌钡白干燥煅烧转窑的控制由经验丰富的操作工人手动调节,这种调节方式取决于工人的经验和责任心,且调节存在比较大的滞后,造
从单张二维人脸照片中重建精确的三维人脸是计算机视觉领域里的一个重要并且具有挑战性的目标,其在人脸识别、年龄估计、人脸表情识别以及情感估计等领域具有重要的作用。三维
如何让机器人实现高精度、高柔顺性的操作,是机器人研究领域长期关注的问题。在机器人学与控制科学、机构学、材料学和计算机科学等交叉领域,已从不同角度对这一问题进行了研究
行人再辨识是多摄像机视频监控中的一个重要任务,其目标在于将多路摄像机在不同时间和地点捕捉到的行人进行自动关联,为行人目标的行为和活动推理分析提供基础。在视频监控中,不
随着机器视觉和图像处理技术的不断发展,视觉目标检测、跟踪及测量技术得到了广泛应用。在航空航天领域中空中目标的视觉检测、跟踪及测量日益受到重视,特别是在空中复杂条件下
本文旨在用智能控制的理论和方法设计特性良好的混沌同步控制方案,并基于DSP进行混沌同步语音保密通信的研究。首先简要分析了现有混沌同步的主要智能控制方案和混沌同步用于
在最近的几年中,计算机技术得到飞速的发展,嵌入式设备使用的芯片主频已经达到400MHz以上,使移动设备具备了进行一定程度的音视频的编解码的能力。无线通信技术也从普通的提
人脸属性识别在人机交互、安防系统等众多领域有着广阔的应用前景,受到了研究者们的广泛关注,已成为计算机视觉和模式识别领域的热点研究课题。目前,由于样本多样性、数据收集困
高可靠性、分散性、开放性、经济实用性和工厂化已经成为现代工业控制系统的特点和要求。本文在对计算机控制系统、现场总线控制系统发展历史的回顾与总结的基础上,提出了Dev
本文重点研究IrDA(InfraredDataAssociation,红外数据协会)协议栈在嵌入式环境下的编程实现,将程序写入目标芯片,使其通过目标板上的红外收发器与移动通信设备(手机)的红外口能