基于轻量化YOLOv5的多任务融合疲劳驾驶实时检测

来源 :太原理工大学 | 被引量 : 0次 | 上传用户:caisilver
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着经济发展,汽车已经逐渐成为了一种大众消费品,随着机动车辆的增加,伴随着的就是安全驾驶问题。造成交通事故的三大主要原因之一就是疲劳驾驶,疲劳驾驶会使得驾驶员降低反应能力,严重威胁自身和他人的生命健康。因此对驾驶员的疲劳进行实时监测很有必要性。目前大多数基于深度学习的疲劳驾驶检测方法在精度上虽然达到了一定的需求,但在速度上都还没有很高的实时性,无法在内存和计算能力有限的车载设备上应用。本文设计了一个轻量级的多任务网络模型来加速检测速度,并融合闭眼时长、眨眼频率、头部姿态及打哈欠等多种疲劳特征综合进行疲劳判定。整个驾驶员疲劳驾驶检测系统共两个模块,分别是目标检测模块和疲劳判定模块。(1)目前通过神经网络的疲劳检测方式对于疲劳特征的定位和状态判定是分离的,本文将在目标检测网络YOLOv5s模型的基础之上设计一款轻量级神经网络模型。该模型可以将眼睛、嘴巴的位置回归和开闭状态判定转化为分类任务,并将头部姿态的回归问题和人脸检测问题进行融合,可以直接在目标检测的过程中输出眼睛、嘴巴的开闭和头部在三个方向的偏向角,避免多模块串联造成的误差累计。(2)为了方便移植到嵌入式设备,降低网络模型的计算参数,将以适合移动端的网络模型Mobile Netv3作为目标检测模型的骨干网络,同时引入了面部跟踪算法来有效利用头部可能存在的区域,有效压缩面部定位耗时。同时在疲劳驾驶应用场景下,为了利用眼睛、嘴巴、面部和驾驶舱之间的空间相关性,将在Mobile Netv3中加入空间注意力机制,来加强对目标位置关注度和各种目标之间空间相对位置的关注度。眼睛在整个检测过程中属于小目标物体,模型将通过双向特征融合的方法将底层位置特征和深层次的抽象语义特征多重融合,来降低由于深层卷积造成的小目标特征丢失问题的影响,提高了对中小目标物体的检测效果。改进后的YOLOv5较之前的参数量降低了21%,对眼睛检测精度达到97%,对嘴巴的检测精度达到99%,且检测速度达到了43fps,较之前提升了48%,便于部署到移动端。(3)将头部姿态回归转化为目标检测任务。传统的检测方式是将检测到的头部放到头部偏向角预测模型中进行姿态回归,本文头部姿态将直接在检测出的人脸的同时回归相应的头部偏向角,将传统的面部检测和姿态回归两种任务融合。任务融合后对于头部偏转角的平均误差在5度以内。(4)依靠单一的疲劳特征检测会存在诸多干扰因素,本文疲劳判定模块将融合各个疲劳特征的评判标准,来制定综合的疲劳驾驶判定规则,并对目标检测模块的输出进行编码。将驾驶员眼睛、嘴巴的开闭状态和头部姿态的异常与否进行0/1编码,并通过定长队列的形式来降低内存的消耗,通过融合的多特征疲劳判定算法计算队列内部相应疲劳特征的疲劳状态,最后综合判定驾驶员疲劳状态。最后通过wx Python搭建图形界面,实现了基于人脸视频的驾驶员疲劳驾驶检测系统。利用人脸视频和摄像头对该系统进行测试,系统可以实时定位并判定驾驶员的眼睛、嘴巴位置和开闭状态,以及人脸位置和头部在三个方向的偏向角,可以很好的满足实际需求。
其他文献
基于场效应晶体管的生物传感器可以将生物信号直接转为电信号进行输出,具有低成本、高灵敏度、低检测限、便携等优点。其中有机场效应晶体管(OFET)由于其本征柔性、延展性和生物相容性,在生物检测领域有着更广阔的应用前景。聚(3-己基噻吩)(P3HT)是制备OFET的一种典型有机半导体材料,具有高效的π-π堆积结构、可控的区域规整度和良好的生物相容性,并且商业化程度很高,引起了广大研究人员的关注。近年来,
学位
为筛选更加省工省时、操作简单、捕杀效果好的灭鼠器械,笔者在甘肃省子午岭林业管理局合水分局大山门林场人工油松林中进行了5种不同捕杀中华鼢鼠器械的防控效果及对相应试验区内油松保存株率影响的试验研究。试验结果表明:5种器械对林区内的中华鼢鼠均有一定的防控效果,且以回缩式双钎鼢鼠捕杀器捕杀效果最佳。该灭鼠器械制作简单、取材广泛、携带方便、操作容易、捕杀率高。不同捕鼠器对油松的保存率存在显著差异性,其中回缩
期刊
烟雾检测是森林火灾预防与有效扑救的前提。由于实际森林火灾烟雾数据获取困难,形成所谓小样本问题。因此提高小样本分类准确度并解决烟雾小样本图像分类识别问题具有重要研究意义。针对森林火灾烟雾数据集小,迁移学习模型获取困难问题,本文采用深度迁移学习方法对森林火灾烟雾识别进行研究,利用训练好的深度卷积神经网络对烟雾图像进行特征提取,采用基于判别特征对齐的域内规划迁移学习算法。主要研究工作如下:(1)提出了基
学位
近年来,区块链技术的兴起推进着社会中各行各业的发展。根据应用背景不同将区块链分为三种:公有链、联盟链和私有链,其中联盟链的发展最为迅速。联盟链中若干机构共同参与管理,数据的读写和发送交易的操作只允许被系统认可的节点进行。同时联盟链通过分布式记录交易数据,极大程度上解决了各机构合作时伴随的数据隐私性及安全性问题。实用拜占庭容错(PBFT)共识算法是联盟链的核心技术,存在动态性缺乏和拜占庭节点处理方式
学位
大数据时代,互联网用户数量迅速增长,产生了海量数据,许多互联网产品和在线电子商务平台也应运而生。广告对许多诸如淘宝和京东等在线电子商务平台来说至关重要,而点击率(CTR)预估就是这些平台所依赖的一个重要信号。精准的点击率预估不仅能帮助广告平台和广告商增加利润,同时也为用户带来更好的用户体验,方便用户浏览到更感兴趣的商品。特征交互是提升广告点击率预估效果的关键,如何提高模型的特征交互能力是点击率预估
学位
三维点云数据语义分割与分类是自动驾驶、智能机器人、场景识别与理解等许多三维感知任务的前提和基础。本文针对PointNet++网络结构在局部特征提取过程中忽略点之间邻域关系与拓扑结构信息,提取到的点云语义信息不足导致语义分割准确度较低的问题,深入研究了基于注意力机制与邻域几何特征的点云语义分割算法;随后,针对PointNet++网络忽略了点云数据密度不均匀引起的非均匀采样问题且模型局部特征提取器网络
学位
近年来,科学技术的进步促进了柔性电子器件的快速发展。柔性电子器件因其生物相容性、延展性和便携性而备受关注。由于柔性压力传感器具有重量轻、灵敏度高等特点,在运动传感器、可穿戴电子设备、电子皮肤中得到了广泛的研究。传统的柔性压力传感器的原理可分为压阻式、电容式、压电式柔性传感等。其中,压电式柔性压力传感器因其灵敏度高、体积小、响应时间短而受到广泛关注,由于其具有生物相容性在生物检测方面表现出潜在的应用
学位
癌胚抗原(CEA)是一种存在于恶性内胚层组织、胎儿结肠粘膜和胃肠道癌患者血浆中的广谱肿瘤标志物。在人体内,众多恶性肿瘤的产生都与CEA有关,包括胃癌、结直肠癌、乳腺癌等。当CEA在体内血清水平高于2.5 ng/m L,往往预示着疾病的发生。众所周知,癌症对于人体的危害极大,治愈率极低。因此,对于癌症的前期诊断具有重要的研究意义。而在众多检测抗原抗体的方法中,电化学免疫传感器凭借着其高灵敏的性能以及
学位
糖尿病已成为全球第一大慢性病,截止2021年,全世界糖尿病人数多达5.37亿。糖尿病最常见的并发症是糖尿病足,该症病变会伴随着足底神经、肌肉等组织功能失常,且与足底各区域压力、温度以及血氧饱和度的异常存在密切联系。为了预防和治疗糖尿病足,本研究根据该病发病机理,将材质柔软,压阻线性关系优秀的柔性压力传感阵列,体积小巧、高精度的红外温度和血氧传感融合于一个系统。本文基于STM32单片机,通过对采样电
学位
软骨组织自我修复能力非常有限,一旦受损,会导致损伤部位肿胀和疼痛,甚至引发更严重的炎症反应。特别是鼻软骨组织的损伤,尽管目前有很多方法可以实现修复,但翻修率超过15%,并且制备适应患者特异性的鼻软骨结构仍然是一个难题。3D生物打印技术可以根据患者损伤部位的图像数据,在计算机辅助下使用细胞和生物材料沉积来精确地制造复杂的个性化组织工程结构,为解决该问题带来了新的思路。生物材料的选择和支架的结构对于使
学位