基于改进检测与再识别的多人特征跟踪技术研究与实现

来源 :内蒙古大学 | 被引量 : 0次 | 上传用户:randomx1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年,深度学习技术飞速发展,不断有人工智能相关的概念或应用被提出来,如智慧城市、智慧安防、自动驾驶等,而行人实时跟踪则在其中扮演了重要角色。行人跟踪任务是多目标跟踪重要子任务之一,该任务的算法通常会将跟踪过程分为两个阶段,即检测与匹配阶段。测阶段的目的是将图像中包含的行人目标使用检测框标注出来,从而定位行人位置,而匹配部分则是负责将前后帧的行人目标关联起来,使得相同行人被赋予相同身份,不同的行人拥有不同身份。因此论文以经典的Deep SORT跟踪算法为基础,通过改进检测部分的YOLOv5算法与匹配部分的再识别算法,实现对跟踪算法的改进,提升其精度与速度。检测方面,论文综合考虑了模型参数与预测精度的问题,决定采用单阶段检测算法YOLOv5进行行人目标检测,并对该算法做了三种改进:一是网络结构部分,论文在YOLOv5的基础上添加了一个小目标检测头,将算法主干网络的底层特征进行复用,提升了算法的小目标检测能力;二是特征融合方面,论文采用Swin-Transformer结构对提取的特征进行融合,利用注意力网络在提取全局特征与融合上下文特征的优势,提升算法的多尺度特征融合能力;最后,论文对损失函数中的CIo U部分进行改进,引入Box-Cox广义幂变换,使得高Io U目标的梯度与损失提升,从而实现算法检测精度的提升。对于再识别算法,论文以OSNet代替传统的残差网络,并对OSNet结构进行改进。主要是在OSNet中添加实例归一化(IN)层,削弱图像风格对特征提取的影响;之后论文构建了一种神经结构搜索空间,通过神经网络框架自动搜索的方式,获取最优的IN层插入位置,实现算法跨域泛化性能的提升。最后,对于跟踪算法,论文将上述的改进YOLOv5检测与改进OSNet再识别结合起来,使用改进YOLOv5进行获取视频帧的检测框,之后分别使用卡尔曼滤波与改进OSNet对检测框进行运动建模与外观特征提取,并利用级联匹配的方式对前后帧检测框进行关联,实现高精度的实时行人跟踪系统。
其他文献
随着我国城市化进程不断加快,城市交通拥堵问题日益显著。交通流信息可以直接体现当前的交通状况,实时获取交通流信息能够方便后续交通资源的合理配置,及时缓解道路拥堵情况,为交通部门的相关决策提供智能化依据。为更准确获取视频中的车流量信息,本文提出了一种基于改进SSD+Deep Sort的车流量检测算法,具体的工作内容如下:(1)针对SSD目标检测算法在基于视频监控的交通场景下对远处小尺度车辆检测效果不佳
学位
近几年,随着国家出台相关政策,坚持“科技兴牛”,肉牛养殖业发展从草原散养正向智能化方向转型升级,而肉牛的个体身份识别技术成为了现代化和精细化养殖的重要基础。作为识别技术的重要组成部分,数据集的研究跟算法相比较为落后。因此本文以牛面部特征为基础,构建了西门塔尔小样本牛脸数据集,对此小样本数据集进行了扩展,并应用图像融合技术进行了牛脸特征增强,最后对所构建的数据集进行了综合评价,具体工作如下:首先构建
学位
近些年来,随着全球气候持续变暖以及不科学的放牧行为,内蒙古自治区鄂尔多斯市鄂托克旗的草场出现大面积退化现象。为实现草地资源合理利用,促进牧场可持续发展,鄂托克旗农牧局采取了一系列信息化技术手段加强对牧场放牧的监管力度。以内蒙古亿维白绒山羊有限责任公司鄂托克旗一分场为试点,在场内架设了14部云台摄像头,实现牧场全天候监控,并采用GPS进行室外羊群定位。由于GPS在功耗、羊只佩戴设备舒适性与人工维护等
学位
随着无线通信技术的发展和5G时代的到来,信息技术革命的热潮迎来新的高峰,面对日益增长的科技应用需求,高效高精的宽带滤波器设计方法尤其重要。微波谐振滤波器是现代通信系统的重要器件,从给定指标到综合出耦合矩阵,调谐得到物理实现的滤波器,是一个漫长的过程。综合的过程包括滤波器阶数的确定,传输零点的确定,回波损耗的指标,从EM设计阶段到物理尺寸的实现,包含调谐和诊断,加工与测试。传统方法在复杂的应用场景中
学位
随着信息科技的不断进步,在万物互联的时代中对于位置信息的需求逐渐增多,卫星等定位技术在室外定位中发挥非常重要的作用,但在复杂的室内环境中表现不佳。随着5G基站愈来愈多,利用多基站的特性可以加强室内定位的精准度,能够为基于到达时间(Time of Arrival,TOA)和基于到达角度(Angle of Arrival,AOA)定位算法提供更精准的估计值。首先,通过查阅了无线定位技术算法的原理,引出
学位
在媒介融合时代,电影除却与电视、互联网等新旧媒介的重组之外,还存在与其他文化空间的“合谋”,如美术馆。在电影从影院“抽离”并介入美术馆的过程中,电影媒介不仅受到美术馆外部空间形态的限制,还接受了其文化机制的根本改造。在经历“拆分”“重组”等适应性调整后,电影从叙事文本变成了影像展品,电影的传受方式从放映转向展览,电影的形态则从“文本”变为由影像、装置、展示空间三者组成的展示机制。由此,一类新的电影
期刊
光频梳作为一种等频率间距且功率近似相等的多载波光源,可广泛应用于信道化接收和波分复用等领域,近些年引起了国内外各研究团队的关注。在生成大量光频梳的基础上,如何提高光频梳的平坦度和边模抑制比,同时降低射频信号的功率成为了研究的重点和难点。本文围绕外调制器法产生光频梳技术路线开展相关研究,提出了两种不同的光频梳生成方案。而后针对光频梳在信道化接收中的应用,设计了两种基于光频梳的信道化接收瞬时频率测量方
学位
双连接技术(dual connectivity,DC)能够融合多重制式网络构成“互通互补”的网络架构,可实现更短的系统端到端时延、成倍增长的吞吐量、更快的聚合速率和更高的鲁棒性,被认为是提升未来异构网络性能的潜在热门技术之一。然而,由于DC技术引入了不同的接入技术和服务质量评估系统,这将使网络环境更加复杂、多样化,为移动性管理带来了新的挑战。本文采用系统级仿真对双连接网络的移动性能进行了剖析,提出
学位
深基坑是指开挖深度大于5 m(含5 m),或者开挖深度不足5 m但地质条件与周围环境极差、地下管线非常复杂的工程。在深基坑工程施工过程中,边坡支护技术直接关系着施工质量和施工安全。但就目前来看,在部分深基坑边坡支护工程项目中,设计、施工环节仍然存在一些不足。因此,本文以深基坑边坡支护工程项目现存问题为切入点,在分析深基坑边坡支护工程项目设计要点的基础上,提出加强施工检测管理等施工管理策略,以期为相
期刊
近年来,由于深度学习及其相关核心技术的迅速更迭,作为其核心,卷积神经网络算法在图像识别、目标检测等方向都得到了广泛应用,但是深度神经网络对硬件平台的要求也在日益提高。目前主要硬件平台有CPU、GPU、FPGA以及ASIC硬件芯片,但是CPU、GPU等平台实现目标检测过程中会存在计算效率低、功耗过大等缺陷,并且体积过大也使其难以应用到小结构平台中,而FPGA功耗低、灵活性高、体积小等优势可以弥补这些
学位