深度学习检测与核相关滤波跟踪技术研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:heyouzhang033
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测与跟踪是计算机视觉领域的研究热点,随着技术的高速发展,逐渐应用到了生活、军事等各个领域。尽管已经有很多优秀的算法被提出,但在实际应用场景中,对检测算法的实时性要求较高,而且尺度变化、遮挡等因素会对跟踪算法造成较大的影响,目标检测与跟踪技术依然存在很大挑战。本文主要研究了基于深度学习的目标检测算法和基于核相关滤波的目标跟踪算法,针对存在的问题做出了相应改进。主要内容与改进工作如下:对基于深度学习的目标检测算法进行研究后,选择YOLOv4-tiny算法为基础算法,提出了一种改进后的轻量化检测网络L_YOLO。该算法的Backbone网络由CSP化的先升维再降维的PDP结构组成,并使用深度可分离卷积大大降低了计算量与参数量。在网络的Neck部分,使用FPN+PAN结构使特征能够同时自顶向下和自底向上传递,提升了检测算法的性能,还增加了一个52×52大小的检测层来使网络更加适应尺寸多变的目标,提升了对小目标的检测效果。在训练阶段使用K-means++算法对训练集的真实目标框的宽和高进行聚类,可以得到更加符合数据集中目标宽高比的初始候选框,加速网络收敛,提高检测的精度。还对训练数据做了旋转增强和Mosaic增强处理,使网络泛化性能更好,进一步提高了检测的精度。本文提出的L_YOLO算法与YOLOv4-tiny相比,模型存储量约为1/13,FPS提高了228,针对特定目标m AP增加了1.72%,可见本文改进算法在存储量、实时性和精度方面都具有优越性。基于核化相关滤波的目标跟踪算法能较好地平衡跟踪精度与速度,故本文在KCF跟踪算法基础上进行改进,研究了该算法的原理与缺点,提出了改进算法L_KCF。首先在原算法基础上融入了颜色特征,使特征之间可以互补。为了解决尺寸固定和目标遮挡的问题,改进算法引入异常值检测,在利用KCF进行跟踪的过程中计算跟踪响应图的PSR与SPSR值,当SPSR值小于等于设定阈值的时候认为当前帧的跟踪结果可靠,继续正常跟踪,否则认为已经出现了尺度变化或目标遮挡情况,暂停KCF的运行,并记录前一帧的PSR和PSRold用于KCF恢复后SPSR的计算,这时利用L_YOLO-d算法进行检测,通过检测算法得到的位置是否在KCF采样框中以及置信度来判断是尺度变化还是目标遮挡情况,使用不同的处理方法,直到重新捕捉到可靠的检测目标。以检测结果为准更新跟踪波门和KCF算法,并恢复KCF算法正常追踪。本文提出的L_KCF算法与原KCF算法相比,精确度高出6.1%,成功率提升约9.9%,鲁棒性更佳,并能更好的应对尺度变化和目标遮挡情况。
其他文献
自组织网络是一种无中心节点的分布式网络,其具有快速组网、灵活部署、抗毁能力强等优点,在军事行动、抢险救灾等方面应用广泛。传输控制协议(Transmission Control Protocol,TCP)是IP网络中一种典型的端到端传输协议,其能够在有线网络中提供高吞吐量的可靠传输。然而,在自组织网络中,无线信道时变且易受干扰、节点快速移动导致网络拓扑的动态变化及多跳传输带来的时延问题,使得TCP并
随着虚拟现实设备的进一步普及,人们越来越追求更具沉浸感的视觉体验,点云作为三维场景的主要表示方式,被视为下一代沉浸式媒体中最为关键的内容之一。现有的三维激光扫描设备可以轻易获得高精度的点云模型,海量的点云数据在为用户提供细腻逼真的场景呈现的同时,也为传输带宽和存储空间带来了更大的压力,因此针对点云数据压缩算法的研究是非常必要的。然而,当前常用的静态点云压缩方案并没有充分考虑到点云模型自身在三维空间
随着无线通信技术的发展,电子设备种类与数量不断增加,导致电磁环境日益复杂。接收机作为电子通信系统的核心设备,其内部包含放大器、混频器等各种非线性器件。干扰信号会使接收机产生增益压缩、互调等非线性效应;宽频带、非恒包络的调制信号使接收机记忆效应更为显著,进而影响接收机非线性效应,导致接收信号失真。因此,开展接收机非线性效应研究,构建接收机非线性行为模型,预测接收机非线性响应,对复杂电磁环境下接收机的
近年来,人口老龄化程度加剧导致老年人口规模膨胀,如何满足数量不断增加的老年人和肢体残疾的人群在室内自由活动的需求和出行需求是当前急需解决的问题。传统的电动轮椅对使用者来说操作难度较大,学习成本较高,且在行进过程中容易发生碰撞。针对上述问题,本文对智能轮椅构建室内环境地图及自主导航过程中涉及的问题进行了研究。论文的研究内容主要包括以下几个方面:首先,利用激光雷达同步定位与建图(Simultaneou
物联网旨在实现万物互联,提供无处不在的服务,支撑着智慧城市、智能家居、工业控制等领域。海量物联网数据接入和分布式服务提供是其广泛应用的核心技术。针对物联网海量设备差异化、通信协议多样化、数据格式私有化、服务提供组合化等导致了物联网数据接入复杂度高、服务组合提供难度大的问题,本文聚焦于异构物联网数据的快速接入和多域物联网服务组合提供方法,设计并实现了物联网平台数据接入和服务提供系统。针对海量异构设备
合成孔径雷达(SAR)作为一种主动式的对地观测系统,可安装在飞机、卫星、宇宙飞船等飞行平台上,全天时、全天候获取遥感数据,分辨率高,且穿透力和存活力极强,因而被广泛应用于军事和民用领域。作为一种独特的侦察手段,SAR在军事领域最主要的应用是实现对特定军事目标的检测和识别,推动军事战场的信息化、现代化以及高效化。因此如何实现SAR图像目标识别具有重要的理论和实践意义。近年来,计算机硬件性能飞速提升,
随着科技水平的发展,水下探测已经成为世界范围内一项重要的科学探测工作。水下光学成像是开展水下科探的重要手段之一,其图像质量是影响探测成效的关键因素。然而,复杂的水体环境致使水下物体成像时受悬浮颗粒吸收和散射作用影响,形成模糊的边界与较低的对比度,水中物体难以被辨认,同时呈现不同程度的蓝绿色偏,不能反映水下物体的真实样貌,也为后续一些图像处理高级任务带来困难。水下图像复原处理能够提升这类图像的清晰程
恒虚警率处理作为雷达系统中实现自动目标检测的重要技术手段,是当今雷达信号处理领域中不可或缺的一部分。雷达工作的电磁环境随着军用、民用无线电技术的快速发展和应用而变得日益复杂,其对目标检测方法的性能要求也在不断提高。最早被提出的经典恒虚警率处理方法由于不具备自适应的特性,在复杂的背景环境中往往无法保持良好的检测性能。因此,如何根据参考单元的样本特性自适应的计算检测门限就成为了恒虚警率方法研究的主要方
学位
随着信息时代的逐步发展,人们对图像分辨率的要求也越来越高。由于通过改进硬件提升拍摄图像分辨率的方案成本较高且存在瓶颈,人们对已获取的图像分辨率也有提升需求,因此,超分辨率重建技术通过使用数字信号处理的方法提高图像分辨率,获得了国内外学术界与商业界的极大关注和深入研究。基于深度学习的图像超分辨重建方法是近年来新兴的一类方法,此类方法主要使用卷积神经网络从大量的低分辨率-高分辨率图像对中学习二者间的映