基于卷积神经网络的行人检测与跟踪算法研究

来源 :武汉科技大学 | 被引量 : 0次 | 上传用户:HELING0702
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人检测与跟踪是计算机视觉领域中重要的组成部分,广泛应用于智能视频监控和人机交互等领域。通过对行人进行检测并获取其运动轨迹,实现对行人目标持续跟踪。受行人快速运动、姿态变化、遮挡等因素干扰,行人检测跟踪算法在实际应用中存在准确度低、鲁棒性差、速度慢等问题。本文针对这些问题从改进卷积神经网络结构角度对行人检测与跟踪算法进行研究,主要有以下几点:
  (1)针对传统的行人检测与跟踪算法进行跟踪时准确度低的问题,提出一种基于GhostNet与注意力机制结合的行人检测与跟踪算法。该算法将YOLOv3的主干网络替换为GhostNet,依靠线性变换得到丰富行人目标特征的多通道特征图,降低特征几何变化的影响;融入注意力机制给予重要特征更高的权值,引入目标检测的直接评价指标GIoU来指导回归任务。实验结果表明所提算法平均测试精确度(mAP)达到了92.53%,结合Deep-Sort算法跟踪时准确度优于改进前及其它算法,可以精确有效地跟踪复杂场景下的多目标行人并具有较强的鲁棒性。
  (2)针对YOLOv51网络在行人检测过程中实时性不足的问题,使用MobileNetV2中的倒残差块构建LightCSP模块来替换YOLOv51网络中的特征提取网络并对模型进行剪枝。在Crowdhuman数据集上验证了算法的实时性。
  (3)针对Deep-Sort多目标跟踪算法IDSwitch较高和速度慢的问题,对Deep-Sort多目标跟踪算法进行改进,检测阶段改用YOLOv51-MobileNetV2行人检测模型,将检测结果送入训练好的网络以提取行人表观特征,并结合卡尔曼滤波器进行运动估计。跟踪阶段引入全局轨迹记忆机制来降低ID切换的次数。在MOT-16数据集上实验结果证明,改进算法有效解决了行人被遮挡跟丢再出现时IDSwitch高的问题,同时满足了行人跟踪的实时性要求。
其他文献
贝叶斯理论为非线性非高斯状态估计问题提供了一种基于概率分布形式的解决方案。粒子滤波是基于递推贝叶斯估计理论的一种序贯蒙特卡罗算法,可以有效地解决非线性非高斯问题,因此被广泛应用于视觉跟踪、目标定位、通信与信号处理等众多领域。  但是粒子滤波算法在递归计算过程中存在粒子权值退化、粒子多样性丧失、维度灾难、计算成本高等问题。针对标准粒子滤波算法存在的问题,本文提出了一种基于“新息误差”的粒子滤波算法,
学位
同时定位与地图构建(Simultaneous Localization and Mapping,SLAM)是移动机器人实现自主导航的关键技术。移动机器人的应用环境较为复杂,在特征密集的大场景环境中,SLAM算法的性能受到很大的影响。与基于滤波的SLAM算法相比,基于图优化的SLAM算法具有实时性更高,能够建立大场景的地图,累积误差更小等优点。但是经典的图优化SLAM算法在复杂环境中运用时,存在局部
热轧带钢是现代钢铁产业中的重要产品,在各行各业中都有较多的应用。热轧带钢的生产过程中,带钢表面缺陷是影响产品质量的一个重要因素。传统的缺陷检测方法检测过程较为复杂,且难以满足快速、准确的缺陷检测要求。基于深度学习的热轧带钢表面缺陷检测系统具有检测准确、检测速度快等优点,但在复合缺陷检测、缺陷目标定位等问题上还存在一些不足。  本文使用多标签分类算法解决热轧带钢表面复合缺陷的检测问题;使用YOLO(
学位
近年来,移动机器人导航相关技术被广泛应用于野外探索、自动驾驶、智能家居等领域。同时定位与建图、路径规划作为导航任务的关键环节,正逐渐成为前沿科技的研究热点。本文对基于激光雷达的移动机器人同时定位与建图、路径规划展开研究,并实现了动态环境下的自主导航。本文主要工作如下:  (1)针对激光SLAM以里程计估计机器人位姿,导致累计误差较大的问题,采用激光雷达扫描匹配结果和最小二乘法进行参数标定;并对激光
四旋翼无人机以其体积小、结构简单、机动性强等优点,在军事、民用等领域广泛应用。四旋翼无人机完成复杂任务的前提是位姿控制的稳定,但在执行任务过程中会受到诸多因素干扰,尤其是不确定性阵风干扰和载荷变化,因此本文针对四旋翼无人机受到外部干扰和变载荷两个方面,使用滑模控制方法设计四旋翼无人机的位姿控制器,其主要研究内容如下:  首先,本文选择X型四旋翼无人机作为研究对象,该结构具有更好的普适性。从分析其结
多智能体系统的编队控制具有十分重要的理论和应用意义。编队控制作为多智能体系统中的一个重要的问题,在生物学、自动控制、机器人、人工智能等领域有广泛的应用。编队控制的目标就是多个智能体在向特定目标或方向移动的过程中,保持期望的几何状态(即编队队形)。编队控制的关键问题就是如何根据局部邻居信息设计合适的分布式控制算法,使多智能体系统实现期望编队。  本文从图信号处理的角度研究了无向网络拓扑图下的一阶、二
近年来,对多智能体系统的分布式控制问题的研究吸引了众多专家和学者的关注。本文采用图滤波的方法,研究了有向拓扑下多智能体系统的一致性问题。通过引入拓扑的归一化图拉普拉斯矩阵,本文提出了时变的分布式控制协议使系统达到加速一致。本文的主要研究工作如下:  1)当有向拓扑归一化图拉普拉斯矩阵的非零特征值为实重根时,设计了基于1-HOP邻居信息的图滤波器。对于有向拓扑已知的情况,得到了系统达到有限时间一致的
球形机器人的驱动单元、传感器和控制单元均包含在球壳内部,具有非线性、强耦合、多变量等复杂特性,是研究多传感器数据融合与控制理论的理想平台。本文针对球形机器人的结构设计、运动学和动力学建模、姿态解算和控制系统设计展开研究。  首先,基于质心偏移的运动方式,设计了一种基于全向轮驱动平台的球形机器人并详细介绍了其系统设计。该球形机器人具有三个对称分布的全向轮,通过控制全向轮在球体内部运动使整体质心产生偏
随着计算机技术和人工智能的发展,移动机器人广泛应用于多种领域,可以有效的帮助人们完成各类工作。本文围绕移动机器人的运动控制和里程计校正方法展开研究,搭建了三轮全向移动机器人(Three-Wheeled Omnidirectional Mobile Robot,TWOMR),并开发了相应的软硬件系统,基于模型预测控制(Model Predictive Control,MPC)理论,设计了一种适用于T
四旋翼无人机通过改变对称分布的旋翼转速来调整位置和姿态,具有灵活机动、成本低廉等优点,逐渐成为科研人员的研究热点。然而,四旋翼无人机具有欠驱动、非线性、强耦合等特点,导致控制系统具有较大的设计难度。本文主要针对四旋翼无人机的飞行控制问题展开研究,主要工作如下:  首先,详细分析了四旋翼无人机的飞行原理和双坐标系的转换关系,在此基础上,根据牛顿.欧拉法推导出四旋翼无人机的动力学模型,为控制系统设计奠