论文部分内容阅读
行人检测与跟踪是计算机视觉领域中重要的组成部分,广泛应用于智能视频监控和人机交互等领域。通过对行人进行检测并获取其运动轨迹,实现对行人目标持续跟踪。受行人快速运动、姿态变化、遮挡等因素干扰,行人检测跟踪算法在实际应用中存在准确度低、鲁棒性差、速度慢等问题。本文针对这些问题从改进卷积神经网络结构角度对行人检测与跟踪算法进行研究,主要有以下几点:
(1)针对传统的行人检测与跟踪算法进行跟踪时准确度低的问题,提出一种基于GhostNet与注意力机制结合的行人检测与跟踪算法。该算法将YOLOv3的主干网络替换为GhostNet,依靠线性变换得到丰富行人目标特征的多通道特征图,降低特征几何变化的影响;融入注意力机制给予重要特征更高的权值,引入目标检测的直接评价指标GIoU来指导回归任务。实验结果表明所提算法平均测试精确度(mAP)达到了92.53%,结合Deep-Sort算法跟踪时准确度优于改进前及其它算法,可以精确有效地跟踪复杂场景下的多目标行人并具有较强的鲁棒性。
(2)针对YOLOv51网络在行人检测过程中实时性不足的问题,使用MobileNetV2中的倒残差块构建LightCSP模块来替换YOLOv51网络中的特征提取网络并对模型进行剪枝。在Crowdhuman数据集上验证了算法的实时性。
(3)针对Deep-Sort多目标跟踪算法IDSwitch较高和速度慢的问题,对Deep-Sort多目标跟踪算法进行改进,检测阶段改用YOLOv51-MobileNetV2行人检测模型,将检测结果送入训练好的网络以提取行人表观特征,并结合卡尔曼滤波器进行运动估计。跟踪阶段引入全局轨迹记忆机制来降低ID切换的次数。在MOT-16数据集上实验结果证明,改进算法有效解决了行人被遮挡跟丢再出现时IDSwitch高的问题,同时满足了行人跟踪的实时性要求。
(1)针对传统的行人检测与跟踪算法进行跟踪时准确度低的问题,提出一种基于GhostNet与注意力机制结合的行人检测与跟踪算法。该算法将YOLOv3的主干网络替换为GhostNet,依靠线性变换得到丰富行人目标特征的多通道特征图,降低特征几何变化的影响;融入注意力机制给予重要特征更高的权值,引入目标检测的直接评价指标GIoU来指导回归任务。实验结果表明所提算法平均测试精确度(mAP)达到了92.53%,结合Deep-Sort算法跟踪时准确度优于改进前及其它算法,可以精确有效地跟踪复杂场景下的多目标行人并具有较强的鲁棒性。
(2)针对YOLOv51网络在行人检测过程中实时性不足的问题,使用MobileNetV2中的倒残差块构建LightCSP模块来替换YOLOv51网络中的特征提取网络并对模型进行剪枝。在Crowdhuman数据集上验证了算法的实时性。
(3)针对Deep-Sort多目标跟踪算法IDSwitch较高和速度慢的问题,对Deep-Sort多目标跟踪算法进行改进,检测阶段改用YOLOv51-MobileNetV2行人检测模型,将检测结果送入训练好的网络以提取行人表观特征,并结合卡尔曼滤波器进行运动估计。跟踪阶段引入全局轨迹记忆机制来降低ID切换的次数。在MOT-16数据集上实验结果证明,改进算法有效解决了行人被遮挡跟丢再出现时IDSwitch高的问题,同时满足了行人跟踪的实时性要求。