论文部分内容阅读
驾驶员行为的识别对于交通安全而言具有重要的现实意义。研究表明,75%的交通事故都是由于违规的驾驶行为引起的,如果可以通过提前识别分析驾驶员行为并进行预警,规范驾驶行为,就可以避免大部分交通事故的发生。随着人工智能、机器学习的发展,车辆也得到了智能化发展,因此产生了智能车辆,智能车辆因其重要使用价值成为了目前研究的热门话题。智能驾驶在实际应用时仍存在很多亟待解决的问题,如行车过程对驾驶员行为的感知不及时,这样的问题会导致行车过程产生危险。因此,这类驾驶的安全问题需要得到重视。影响智能驾驶的因素有驾驶员,智能车,道路情况,行人情况;本文中,我们针对智能驾驶中的驾驶员这一要素开展驾驶员行为识别的研究。为了更好地识别驾驶员的行为,通过智能车内安装的摄像头获取驾驶员的相关数据,使用计算机视觉技术和机器学习方法对实验数据进行分析,通过最终得到的识别结果对驾驶员进行相应的提醒。在驾驶员行为中,本文针对驾驶员的手势行为和驾驶员头部行为两种行为进行分析,以此作为本文的研究核心。随着智能驾驶实际应用场景的变化,数据集的数据量和计算量都在增加,相应的使用环境也不再是单一场景,基于传统的识别算法已经不能满足现在的智能驾驶需求。因此,本文中选择使用基于深度学习的行为识别算法。与传统的识别算法相比,这类方法已经在行为识别上取得了良好的效果,在识别的准确率和速度上都进行了提升,但这类方法在面对智能驾驶应用场景时仍存在一些问题需要解决。这些问题包括行车数据的稳定性,数据采集的环境影响等,这些问题的存在会直接影响最终识别的准确率。为了更好地解决这些问题,我们针对驾驶员手势行为和头部行为进行了相关研究。本文的具体工作如下:首先,在驾驶员手势识别的问题上,针对VIVA Challenge Dataset手势数据集中存在噪点的问题,提出了一种基于卷积与反卷积结合的去噪方法,这一方法减少了原始数据集中的噪点。在考虑到数据集中同时包含RGB图像和深度图像的前提下,提出将深度图像与RGB图像的视频帧进行逐帧交错的方案,并通过将残差思想与3D卷积神经网络(3D Convolutional Neural Networks,3DCNN)相结合进行训练,实现对驾驶员手势数据的分类与识别。最终的实验结果表明,这种模型和去噪方法在处理手势数据分类问题上有一定的优势,同时论证了交错帧的信息有效性。其次,针对Kaggle数据集中包含RGB图像和深度图的特点,将深度图与RGB图像相结合,充分利用两种模态提供的丰富信息,提出了一种多模式特征融合的驾驶员手势识别方法。为了更好地利用深度手势视频中的有效信息,我们设计了一种改进的基于权重的帧选取方法以从给定视频中选取更具代表性的帧。此外,为了更好地将信息进行最大化地利用,通过Res Next网络提取特征,然后将特征嵌入分支(Feature Embedding Branch,FEB)方法用于静态数据,将静态数据包含的信息进行更大程度地利用。之后,将处理后的静态数据特征和动态数据特征通过DCA(Discriminant Correlation Analysis)方法集成在一起,将各方信息进行融合,并使用线性SVM(Support Vector Machine)分类器进行分类。通过实验发现,这一方法的分类准确率为98.35%,优于当前对比方法,因此适用于智能汽车界面中的手势识别。最后,针对驾驶员头部行为的识别,提出了一种基于Yolov4和注意力机制的驾驶员头部行为的分类方法。首先,我们使用Yolov4对驾驶员上半身数据集进行训练,以快速、准确地提取驾驶员头部的图像。然后,使用Resize方法将所有头部图像重塑为相同大小。之后,为了更精准地识别驾驶员头部行为,将数据集进行重分类,使其所包含的类别更丰富。此外,为了提取更具判别性的特征,提出了一种包含全局注意力的注意力机制(由主干(trunk)和掩码(mask)分支组成),同时在TSE-mask(Transformed SE-mask)分支中使用改进后的SE注意力块来获取其他关键特征。实验结果表明,该方法可以达到83.26%的分类准确率,实验表明该方法优于其他对比方法,因此适用于驾驶员头部行为识别的应PULSE(Photo Upsampling via Latent Space Exploration)方法用场景。另一方面,由于驾驶员上半身数据集存在类间不平衡的问题,因此需要充分利用数据集中的原始图像,使用将对焦失败图像进行还原,可以充分利用数据集的原始图像。然后在Res Ne St算法中引入自矫正卷积,以此保证在参数量基本不变的情况下获得更好地分类效果。实验结果表明,与其他对比方法相比,这一方法可以更快更好地识别并判断驾驶员状态。本文通过解决驾驶员手势行为和驾驶员头部行为的分类和识别问题,希望能够在一定程度上保证驾驶员在智能驾驶过程中的安全性,为智能驾驶的实际应用场景提供更多的解决方案。