深度学习目标检测与改进KCF的跟踪算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:kxianwen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机视觉领域中的目标检测与目标跟踪技术已成为研发热门领域,并广泛应用于交通、医疗与军事等领域,智能化人们的生活。在现实的工程技术应用中,对检测算法有高精确和高实时性的需求,对跟踪算法则有抗遮挡性和尺度变化的要求,所以深入研究目标检测与跟踪技术具有重要的应用价值。本文针对现实工程应用时高速轻量化的算法需求,对比研究分析了检测领域现有的多种算法的检测性能,从中选择、研究和改进了YOLOv4-tiny目标检测算法,并提出一种轻量化的LD_CFSM检测网络。改进网络选择深度可分离卷积,取代Backbone网络中的普通卷积算法,以降低计算参数量,同时在Backbone网络的有效特征层后引入CBAM注意力机制,更加关注通道与空间两个方面的特征,在轻量化模型的同时保持算法精度。然后选取Focus结构替换主干特征提取网络的第一个卷积模块,进行切片操作汇总原始图像的信息至通道空间,防止特征丢失,使网络更加注重目标轮廓特征的学习。最后,在特征进入网络的Neck部分进行高低维融合之前引入SPP-Net结构,通过排列合并多个不同核大小的最大池化结果,扩大网络的感知区域,加强特征复用,提高了检测精度。并使用旋转和Mosaic增强策略丰富训练数据,提高网络的泛化性,进一步提高检测精度。选取同一特定目标数据集进行的仿真试验表明,本文提出的LD_CFSM算法在原始算法的基础上,m AP增加了9.67%,模型存储量减少了2/3,经试验及分析证明LD_CFSM算法的改进机制,在检测精度和存储量方面具有一定的有效性。随着智能技术的联合研究,相关滤波类的跟踪算法以兼具精度和速度的优势而著名,因此选择此类算法中的典型算法KCF进行改进,实现工程需求。本文先是研究KCF跟踪算法的原理,并针对算法缺点做出优化,提出了改进的KCF_LD跟踪算法。该算法融合多尺度检测以灵活适应目标的尺度变化,通过二维位置滤波器和一维尺度滤波器的联合检测,采用33个不同尺度进行多尺度检测,增加算法的灵敏度,提高跟踪定位的准确性。由于KCF在每帧跟踪结束后都会进行模型更新,使得算法在遮挡场景中的跟踪性能较差,通过引入模型更新可靠性判别机制并结合检测算法,提高算法的抗遮挡性。模型更新的判别依据是跟踪结果响应图APCE指标,当APCE值低于均值时,跟踪停止,使用LD_CFSM算法开始全局检测确定目标位置,同时依靠检测置信度阈值保证检测的准确性,恢复跟踪任务。经试验验证,本文提出的KCF_LD跟踪算法相较KCF算法,跟踪精确率提升了3.2%,成功率提高了4.1%,鲁棒性更强。
其他文献
伴随着芯片尺寸的缩小和功耗密度的增加,其发热问题亟待解决。如何通过热设计保证电子芯片的可靠运行,成为了一个不可忽视的要点。因此本文设计了一种交错双P型微通道换热器,并通过数值计算和实验研究的方法分析了换热器的换热性能和机械性能。具体研究工作如下:首先,提出了三种不同结构的散热器,即传统直通道设计、增强设计和交错双P型设计,并建立了相应的数值仿真模型,将三种换热器的换热性能进行对比研究。发现,在传统
学位
文章基于城镇化大背景,以贵州黔南都匀毛尖镇民族杂居村寨为研究个案,通过田野调查,对都匀毛尖镇民族杂居区少数民族语言使用现状、语言兼用及转用情况、语言态度等的定量、定性分析,结论认为,黔南都匀毛尖镇民族杂居区语言关系呈多语和谐的样态。具体表现为:单一民族相对聚居的民族村寨,母语使用较为稳定;多民族散杂居的民族村寨,母语使用功能正在弱化或趋于濒危;全民普遍自觉地兼用汉语;不同语言功能互补;语言态度开放
期刊
对视觉场景的完全理解被视为计算机视觉领域的“圣杯”,为了实现对视觉场景的完全理解,以更好的完成视觉问答、图像字幕等较为高级的计算机视觉任务,学者们提出了场景图生成问题。场景图是一种图形数据结构,负责描述图像中的对象与对象之间的关系,场景图通过节点表示场景中的对象,而连接节点的边则表示场景中各种对象之间的关系。通过场景图,人们可以获得图像中场景的语义表示,是进一步完成场景理解的基础。囿于现有场景图生
学位
报纸
近年来,随着计算机技术,人工智能技术,传感器融合技术的发展,机器人技术得到了长足的进步,对机器人的研究已经从理论研究发展到实践使用,单机器人的工作效率和稳定性都有了充分的保证。但单机器人功能和稳定性的提升,并不能满足随着应用范围的扩大化和应用任务的复杂化所带来的新需求,国内外学者们开始把目光放在多机器人系统多机器人任务分配问题(Multi-Robot Task Allocation,MRTA),这
学位
随着生活水平的不断提高,人们日常对于车辆的需求也越来越大。汽车数量的逐步增长为现有的交通带来越来越大的压力,并引发了各类交通违法案件。针对这些问题,许多专家学者致力于研究智能交通系统。智能交通系统是在已有的道路监控系统的基础上,运用人工智能技术将数据的传输、预处理和智能控制系统等进行有机结合,从而使整个交通体系合理化、智能化。在智能交通系统中,车型识别和车辆重识别技术可应用于多种交通场景下,在缓解
学位
目标检测和目标跟踪是计算机视觉领域的两个重要的研究方向。智能嵌入式目标检测与跟踪系统是一种通过机器学习和深度学习算法自动检测目标位置并进行实时跟踪的系统。随着智能目标检测和目标跟踪算法性能的提高和复杂应用场景下对系统集成度的更高要求,开发新一代具有更高算力、更小体积、更低功耗的智能嵌入式目标检测及跟踪系统是一个非常重要的研究课题。本文设计并实现了以XC7K325T FPGA和TMS320C6674
学位
在同一个业务流的数据包的网络协议报头之间,大部分字段呈现有规律的变化,因此存在着大量的冗余信息。由于这些冗余信息占用了无线通信中最为稀缺的带宽资源,所以在无线传输时需要对网络协议报头进行压缩,以节省带宽资源,同时提高传输效率。常用的报头压缩方案是鲁棒性报头压缩(Robust Header Compression,ROHC)方案,该方案针对特定网络协议报头采取定制的压缩方法。如果将其应用于其他网络协
学位
随着5G通信技术的飞速发展,虚拟现实(Virtual Reality,VR)与增强现实(Augmented Reality,AR)等流媒体技术因能够构建出一个可交互、沉浸式的虚拟世界而成为当前研究的热点。而作为VR/AR技术的重要组成部分,360度视频能够通过VR设备,如头戴式显示器(Head Mounted Displays,HMD),为观众提供沉浸式体验。然而,由于360度视频具有低延迟、高比
学位
报纸