论文部分内容阅读
针对行人的主动安全一直以来都是智能驾驶领域非常关注的话题,车载相机获取的主要为远距离低分辨率图像。已有的针对远距离低分辨率图像的人体头部与身体姿态估计方法,主要采用传统的特征提取方法,检测精度较低。传统的头部姿态与身体姿态联合估计方法局限于构建空间与时间模型,模型过于复杂,且实时性低。对此,本文主要开展了如下研究工作:(1)将深度卷积神经网络(CNN)方法应用于人体头部与身体姿态估计。相比传统方法人工设计的特征,深度卷积神经网络中的卷积层,能够自动学习最优特征。其训练过程中的反向传播机制,使得网络收敛于全局最优解。本方法在CAVIAR头部姿态数据集上取得的Accuracy1精度为86%,在TUD身体姿态数据集上取得的Accuracy1精度为83%。相比于传统算法,不仅精度得到了明显提升,而且具有实时性。(2)将基于多任务学习的深度卷积神经(MTL-CNN)方法应用于人体头部与身体姿态联合估计。针对现有方法将头部姿态估计与身体姿态估计任务分开进行的不足,考虑到头部姿态估计任务与身体姿态估计任务的相关性,将人体头部姿态与身体姿态进行联合估计。本方法提出的多任务学习模型相比于单任务模型具备更强的泛化性能,采用MTL-CNN模型在本文制作的数据集上Accuracy1精度相比于CNN模型提升1~2个百分点,且具有实时性。(3)将基于双源输入的深度卷积神经网络(DS-CNN)方法应用于人体头部与身体姿态联合估计。由于头部区域图像相比于身体图像分辨率更低,头部姿态估计精度往往低于身体姿态估计精度。考虑到人体头部姿态与身体姿态的一致性,将人体头部姿态特征信息与人体身体姿态特征信息融合,从而提升头部姿态估计精度。采用本方法在本文制作的数据集上Accuracy1精度相比于CNN模型提升了3.2个百分点。头部姿态信息在一定程度上提升了身体姿态估计任务的泛化能力,使得身体姿态估计精度提升了1.5个百分点,且具有实时性。本文提出的人体头部与身体姿态估计方法有望应用在智能驾驶领域,用于判断行人注意力方向以及预测行人行走轨迹,提前做出安全预警,从而避免碰撞事故的发生,提升道路安全。