面向复杂场景的相关滤波跟踪方法

来源 :中国石油大学(华东) | 被引量 : 0次 | 上传用户:lx84015092
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标跟踪是计算机视觉领域中的一个重要研究方向,包含许多尖端技术,如模式识别和图形图像处理等。今天,国家正在大力建设智慧城市,而目标跟踪技术主要应用于智能视频监控、智能交通、无人驾驶、军事等领域。现实生活场景较为复杂以及目标自身的形变等因素,此外,对计算机硬件及跟踪算法实时性的要求,现有基于视频序列的单目标跟踪技术尚未被大规模商用。因此,找到一种满足实时性要求且具有较高鲁棒性的跟踪算法具有重要的研究意义和广阔的应用前景。通常,目标跟踪技术被分为2类:生成模型和辨别模型。生成模型只考虑如何在忽略周围背景信息的情况下准确构建目标,跟踪性能不是很好;而辨别式模型既有效地利用了目标信息也充分利用了背景信息,此类方法表现出良好的性能。基于相关滤波器的目标跟踪算法作为辨别式模型中的一种,近些年取得了较大的进展,利用循环移位方法进行样本数量地扩充,使用目标区域及其周围背景区域在线训练分类器,并将训练分类器和检测目标的过程放到傅里叶域中进行,大大加快了计算速度,因此这类算法非常效。研究发现这类算法具有极好的拓展性,本文对现有的基于相关滤波器以及引入深度学习的相关滤波跟踪算法进行深入研究,主要工作:提出了一种面向复杂场景的相关滤波跟踪方法,称为基于相关滤波器的多模板跟踪算法。该算法从3个不同的方面扩充和改进了基于相关滤波器的跟踪方法,首先从目标表达能力着手,通过对手工特征和卷积神经网络提取的深度特征进行深入对比研究,同时为了保证准确性和实时性,本文对图像或图像区域分别提取深度特征和Color Name特征,所获得的2个特征图分别由相关滤波器学习,以获得不同的滤波模板;然后采用相关滤波跟踪算法获得2个特征下的响应集合,并对所得到的集合进行加权融合,通过判定极大值中的最大值得到最终的目标位置;最后进行目标尺度值的更新,现有方法仅基于当前帧的目标信息使得目标尺度值估计不准确,本文使用贝叶斯统计通过最大化后验的方式估计目标的最佳尺度值,同时更新相关滤波器参数,以实现自适应尺度的目标跟踪。本文提出的算法在OTB2013和OTB2015这2个基准数据库上进行实验,并与当前优秀的6种算法进行比较,结果表明,综合准确性与实时性考虑本文所提算法性能最优,并且在2个数据集上的成功率OP(AUE)较经典KCF算法分别提升10.7%和12.4%。
其他文献
随着计算机视觉的不断发展,视频摘要技术已经广泛应用于人们生活的方方面面。目前,计算机硬件的性能不断提升,日常生活中产生的视频数据急剧增加,为基于海量数据研究的视频摘要提供了良好的机遇。视频摘要是指通过对视频结构和内容的分析提取出有代表性的部分,再以某种方式组合成概要,它能充分表达视频的主要内容。算法研究中,特征的描述能力不足易造成关键内容检测不当,使摘要效果变差。而且视频摘要的选取需要满足不同用户
进程间通信是操作系统功能中的重要组成部分。操作系统内核提供进程间通信功能,并为用户进程提供接口,用户进程通过系统调用,可依据需求,采用不同的进程间通信机制完成信息的发送、接收。本文阐述基于Intel体系结构的操作系统原型FishOS内核中进程间通信模块的设计与实现,详细说明如何实现本地进程间通信功能以及异地进程间通信功能。本课题在Linux环境下实现了基于FAT32文件系统的自启动系统引导程序、键
进入21世纪以来,物联网(Internet of Things,Io Ts)技术发展迅速,在许多领域得到广泛应用。例如物联网在智能物流、智能交通、智能建筑、环境监测等方面的应用,取得了重大突破,极大的影响了人们的生产和生活方式,提高了生产力,使人类社会更加智能、高效。无线射频识别(Radio Frequency Identification,RFID)技术是物联网技术的核心支撑技术,RFID技术的
随着物联网的快速发展,数据融合技术已被广泛用于处理物联网环境中产生的大量数据。数据融合是物联网多源信息综合处理的一项新技术,它能将来自某一目标的多源信息提取、处理、分析、综合多传感时空上的冗余或者互补信息,从而生成比单一信源更精确、更完全的估计和决策。物联网环境中的数据融合需要收集和处理具有混合时间特征的各种数据,包括实时和非实时数据。目前数据融合的大多数研究都是关于数据处理方面的,但是数据融合需
随着数字油田与油田物联网的高速发展,油田生产过程中各类生产数据得到了有效存储,这些数据真实可靠的记录了油井状况,具有非常高的真实性和研究价值,有效分析并利用这些数据可以更好的指导油气生产和战略决策。目前油田在数据处理方面存在分析方法单一、相关技术人才不足、缺乏对大数据挖掘全生命周期的管理支持、数据分析操作过于复杂并缺乏灵活性等问题,因此油田迫切需要智能大数据处理平台实现油田数据的灵活处理。为解决上
随着计算机技术的迅速发展,计算机视觉可处理的数据量不断增大,三维模型被广泛地应用于各个领域。近年来,手机人脸解锁技术已全面普及,二维人脸信息的获取技术已相对成熟,三维人脸重建成为计算机图形图像领域的一大研究热点。当前,很多研究者使用人脸的二维图像特征结合三维形变模型(3D Morphable model,3DMM)的方法进行人脸三维重建,其中大部分都是针对单张二维图像进行重建,由于多角度信息的缺失
近年来,随着计算机技术及网络技术的发展,XML格式的数据呈爆炸式增长,对XML进行查询日益受到关注。对XML数据进行查询主要有两种查询方式:结构化查询及关键字查询。其中,关键字查询简便,用户体验良好,受到用户的青睐。最近几年,针对XML数据查询方面的工作集中在对XML数据进行关键字查询方面。其中,查询效率是各位专家学者的重点研究内容。为了提高关键字查询的效率,设计了一种基于预留区间值的查询算法。该
大量的社会心理学研究表示,视线通常在注意力分析和人际交流中扮演着重要角色。经过30多年的研究,研究人员提出了多种视线估计解决方案,也产生了具有高精度的商用系统。然而,大多数商用系统需要侵入式的专用硬件且使用场景受限。因此,低成本、非侵入式且适用于任何头部姿态的视线估计算法成为当前的主要研究方向。本文在彩色图像的基础上加入深度图像提高头部姿态估计的准确度、加入红外图像增加算法的适用范围,故提出了一种
操作系统中多进程并发执行提高了资源的利用率,但也可能造成系统中的若干进程相互等待对方释放所占用的资源,进而引起僵持。此时每个进程均在等待被其他进程所占有的资源,系统处于停滞状态,即进程死锁。它是操作系统、数据库系统乃至并发程序设计中最难以处理的问题。脉冲神经膜系统是一类新的计算模型,它是受神经元之间的信息交流启发得到的。具有与图灵机等价的计算能力,是当前神经网络研究的热点。本文把脉冲神经膜系统应用
视频目标分割,即对视频中的关键目标进行像素级的分割,在基于内容的检索、智能监控、视频会议等领域有着越来越广泛的应用。近些年诸多优秀的算法相继提出,但是由于无约束视频中存在的非刚性形变、剧烈运动、目标遮挡等一系列干扰,使得该技术面临着很大的困难及挑战,完全没有用户标注的无监督视频目标分割,对目标分割算法提出了更高的要求。如何设计出一个鲁棒的、快速的且精准稳定的视频目标分割系统来满足实际需求,具有非常