基于YOLOv3目标检测算法的驾驶员疲劳检测实现

来源 :中国新通信·理论版 | 被引量 : 0次 | 上传用户：luminfeng

【摘要】

：

【作者】

：

阳家伟何鑫任月

【出处】

：

中国新通信·理论版

【发表日期】

：

2020年2期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

　　摘要：针对汽车驾驶员疲劳驾驶易导致交通事故这一问题，该文提出了基于YOLOv3目标检测算法的驶员疲劳检测实现方案。YOLOv3算法主要采用Darknet53作为主特征提取网络，在保证检测精度的同时提高检测精准度。YOLOv3算法作为获取驾驶员面部体征提取算法，将得到的眼部数据，计算判断的得出眨眼频率，PERCLOS算法分析判断驾驶员是否疲劳。试验表明，所提出的检测模型的mAP为90.30%，帧率58fps，能够适应实时监测的要求。
　　关键词：疲劳监测;YOLOv3;PERCLOS
　　介绍：随着汽车数量的逐渐增多，随之而来的是交通事故的增加，国家统计局数据显示，2018 年全国交通事故高达 2.4万起。在的交通事故中，由疲劳驾驶引起的事故比例逐渐增加，驾驶员疲劳驾驶已经成为导致交通事故的主要原因[1]
　　当前，国内外众多研究学者针对于如何对汽车驾驶员是否疲劳开展广泛深入研究。主要分为三类主要方法。第一类，基于驾驶员人体体征数据参数[2]。该方法主要通过人体体征数据分析驾驶员是否疲劳。虽对是否疲劳检测的准确性较高，但由于检测设备过于庞大且检测过程较为复杂，导致了可能会对驾驶员正常的驾驶汽车造成一定的影响。第二类，基于车辆行为检测检测[3-4]。该方法通过对行驶中汽车的行驶的车速、加速度、方向盘转角等汽车行驶信息来进行判断。不同品牌的汽车参数性能各不相同，同时不同地形的路况也会对汽车的表现造成一定影响，因此方法存在一定的局限性。第三类，基于计算机机器视觉检测[5-7]。主要通过车影像设备能够实时获取驾驶员行驶汽车过程中的脸部信息，再通过训练好的算法模型对采集到的脸部信息进行面部特征提取，然后通过分析正常情况下眨眼的频率与频率状态下的眨眼频率，分析判定驾驶员的当前是否处于疲劳状态。此方法能够最大程度上的减少对驾驶员正常驾驶汽车的影响，并具有一定的准确性。
　　驾驶员的疲劳检测，因为应用于汽车行驶的过程中，需要的是实时数据，因此对目标检测算法的实时性有着很高的要求。目前基于深度卷积神经网络（Convolution Neural Network，CNN）的算法应用于三大类目标检测算法：第一类方法是基于学习搜索的检测算法，这类算法与其他算法的不同点在于，是通过将图像特征提取任务转换为动态视觉搜索任务，这样虽然能够很好的提高了特征提取的速度，但是也会出现检测精度不足的问题。第二类方法，基于候选区域目标检测器的目标识别算法。如 Fast R-CNN[8]、Faster R-CNN[9]等，这类算法检测精度较高，但检测速度较慢，需要占用大量计算资源;第三类方法是基于回归方式的目标检测算法，如 YOLO（You Only LiveOnce）[10][11]系列算法等，此系列算法在不仅在保证目标检测准确率高的同时，在检测速度方面也表现出优越的性能。目前YOLO 系列算法已经发展到第三版本即 YOLO V3，在对实时性要求比较高的目标检测任务当中表现相当出色。本文基于YOLOv3[12]目标检测算法的实现对驾驶员疲劳状态的检测。
　　二、算法
　　2.1 YOLOv3 算法
　　YOLOv3 算法相比较于前两个版本，主要进行了三方面的改进：
　　（1）新的网络结构 Darknet53，主要借鉴 ResNet 残差网络思想。在原有的基础网络中大量使用残差连接，缓解了训练中梯度小时的问题，使得能够将网络设计很深，当网络层次越深，特征表达的效果就越好，分类与预测的性能就能得到提高;
　　（2）新的特征提取网络，主要采用多尺度融合预测方法。YOLOv3 算法使用 13*13、26*26、52*52 这三种不同尺度的特征图进行预测，采用金字塔网络[13]进行提取特征，通过上采样特征合并，能够得到更丰富的语义信息，极大的提高检测算法对微型目标检测精度。
　　（3）分类损失函数替换。YOLOv3 算法替换了原来的Softmax 函数改为 Logistic 函数。Softmax 函数输出多个类别预测之间会互相抑制，Logistic 分类器相互独立，可实现多类别预测。
　　2.2 特征提取网络 Darknet – 53
　　YOLOv3 算法采用 Darknet – 53 为特征提取网络，Darknet – 53 网络中有 53 个卷积层，采用 LeakyReLu 作为修正函数。网络结构如图 1 所示。图中各块意义如下：
　　DBL：代表卷积、BN 及 Leaky ReLU 三层的结合。
　　Res：代表残差块。
　　上采样：上采样使用的方式为池化，即元素赋值扩充的方法使得特征尺寸扩大。
　　Concat：上采样后将深层与浅层的特征图进行 Conncat操作，即通道的拼接。
　　从图 1 中可以看出 Darknet – 53 结构的一些新特性：残差思想、多层特征图、无池化层。
　　2.3 疲劳识别
　　PERCLOS（percentage of eyeIid cIosure over the pupiI）[14]，PERCLOS 算法指的是在一定单位时间内眼睛闭合时间所占单位时间的比例，当眼睛闭合比例达到 70%或 80%时，则认为出现疲劳。
　　计算公式如下：
　　其中单位时间 T 取 ?单位时间 = 20s，??为每次眨眼时眼睛闭合所用的时间。
　　三、实验结果与分析
　　3.1 实验环境
　　本文的实验模型训练环境配置：
　　Intel（R） Core（TM） i7-8700
　　處理器，64G 内存，NVIDIA RTX2080Ti 显卡，CUDA 版本10.0，CUDNN 版本 7.4，OpenCV 版本为 3.3，操作系统为windows10。　　网络参数配置如下：动量为 0.9，权重衰减为 0.0005，迭代次数为 500200，学习率使用分步策略，初始值设置为 0.001，变化的次数为 400000 和 450000，比率为 0.1 和 0.1。
　　3.2 评价指标
　　在实际对于驾驶员是否疲劳状态检测的实际应用中，识别的准确率和速度尤为重要。若实际检验中出现状态不准确，则十分容易导致对驾驶员疲劳检测出现错误。当驾驶员已经处于疲劳状态，但系统仍然未能做出检测，则依旧会存在安全上的隐患。
　　本文采用每个类别相互独立的平均精确率均值 mAP（meanaverage precision），与每秒机器能够检测到图像数量的帧数 FPS（frames per second）作为目标检测模型性能好坏的评价指标。
　　精确率与召回率的定义如下：
　　以本文为例，TP（True Position）：表示预测框正确地与标签匹配，即能够准确预测出眼睛状态的数量;FP（FalsePositon）：表示将背景预测成物体，即指将脸部部位识别为眼睛数量;FN（False Negative）：表示本来需要检测出的物体，模型没有检测出，即眼睛没有检测出的数量;TN（TrueNegative）：表示检测目标本无背景，检测模型也没能够识别出背景，即指脸部，并没有识别出的数量。以召回率为横坐标，以识别的精准度为纵坐标，最终绘制出一条 P-R 曲线。曲线下的面积即为 AP ，AP 综合考量了不同召回率下的准确率，不会对 P 与 R 有任何偏好。每个类别的 AP 是相互独立的，将每个类别的 AP 进行平均，即可以得到 mAP。
　　3.3 测试结果
　　根据以上计算指标得出模型的综合性能如表 1 所示，从表中可以看出检测精度与召回率都比较高，F1-score 也高达 89%整体的应用性能较强。
　　另外，从图 1 模型训练的 loss 曲线中可以看出，随着迭代次数逐渐的增加，十分明显的可以看出收敛速度较快，同时也能够达到很不错的学习效果，因此这一个具有代表性意义的典型特征结果可以得出结论模型的学习能力较强。
　　针对于采集到的数据集，采用 YOLOv3 检测模型进行检测，P-R 曲线如图 2 所示，mAP 达到了 90.30%，一系列可靠实验的结果表明模型具有良好的普适性。
　　如表 2 所示，采用同一数据集与其他主流目标检测模型的性能对比后发现，YOLOv3 与 Faster R-CNN 在精准度上都达到了 90% ，但 Faster R-CNN 在检测的帧率上远远不如YOLOv3，达不到实时检测的需求。虽然 YOLOv3 在检测速度上比 YOLOv2 略低，但在满足实时检测的帧的同时还保证了检测的精准度。
　　四、结束语
　　本文主要研究，提出了基于 YOLOv3 目标检测算法实现对驾驶员疲劳状态检测方法。通过一系列大量具有重复性的精准良好的结果均证明 YOLOv3 在目标检测任务中在检测速度与精度的上表现出良好的优越性。同时，结合 PERCLOS 疲劳判断方法在是否判断上具有的普适性，能够实现对驾驶员是否疲劳的实时检测。通过实时数据检测表明，该方法在检测精度与实时性两个方面均展现出良好的性能。在后续研究中，将会考虑将模型移植到移动设备中，以适应生产应用。
　　参考文献：
　　[1]Mandal B ， Li L ， Wang G S ， et al. Towards Detection ofBus Driver Fatigue Based on Robust Visual Analysis of Eye State[J].Intelligent Transportation Systems， IEEE Transactions on， 2017，18（3）：545-557.
　　[2]胥川，王雪松，陳小鸿，等. 基于决策树的驾驶疲劳等级分析与判定[J]. 同济大学学报（自然科学版）， 2013， 43（1）.
　　[3]Gustavo Lenis， Patrick Reichensperger， David Sommer，等. Detection of microsleep events in a car driving simulation studyusing electrocardiographic features[C]// Current Directions inBiomedical Engineering. 2016.
　　[4]Xiaoliang Z ， Jiali L ， Yugang L ， et al. Design of a FatigueDetection System for High-Speed Trains Based on DriverVigilance Using a Wireless Wearable EEG[J]. Sensors， 2017，17（3）：486.
　　[5]李锐，蔡兵，刘琳，等. 基于模型的驾驶员眼睛状态识别[J]. 仪器仪表学报， 2016， 037（001）：184-191.
　　[6]Feng D ， Feng M Q . Computer vision for SHM of civilinfrastructure： From dynamic response measurement to damagedetection-Areview[J].EngineeringStructures，2018，156（FEB.1）：105-117.
　　[7]Xiaoyun J ， Lingyu Z ， Jiang R ， et al. Research onFatigue Driving Detection Method of Facial Features Fusion[J].Power System and Clean Energy， 2016.

其他文献

浅谈港口生产中 GIS地理信息管理系统的开发

摘要：GIS系统通过物联网领域的GPS（DGPS差分全球定位系统）、无线网络、移动终端、车载终端、GIS（地理信息系统）及数据仓库等技术实现对港口业务的实时监控。　　DGPS是英文Differential Global Positioning System的缩写，即差分全球定位系统，方法是在一个精确的已知位置（基准站）上安装GPS监测接收机，计算得到基准站与GPS卫星的距离改正数。目前在港口应

期刊

传输系统视频通道白屏问题研究

摘要：CCTV系统通过传输系统的H.264视频板卡，汇集各个站点图像供调度人员和行值人员调看及大屏显示。二号线传输的视频板卡编码过程中出现异常，导致某些站点的图像上传至控制中心客户端时显示为白色画面中间有个图标，为问题状态，此问题简称白屏问题。经过多次排查，确认传输系统视频板卡某些通道的存在问题。此问题最终定位为视频板卡H.264的软件BUG，需升级所有H.264板卡的固态软件firmware

期刊

试论计算机网络数据库的安全管理技术

摘要：随着信息化时代的到来，计算机技术在诸多行业领域的运用极大的提升了生产效率，对社会经济的快速发展提供了强有力的技术支持。广大个人用户的工作生活也逐渐融入了计算机技术，便捷了交流和信息传递方式的同时，也解决了人们日常生活中的常见问题。然而，计算机网络数据库的安全管理若不积极落实，便会引发一系列的网络安全问题，如窃取用户隐私信息和企事业单位的高价值信息等。为此，本文就其安全管理技术的优化措施进

期刊

计算机网络安全问题及其对策总结

摘要：在当前计算机网络技术已经深入至人们生产生活中诸多内容的情况下，计算机网络技术对于提升当前人们生产生活的便捷性发挥了非常积极的作用，但同时也带来了计算机网络技术使用过程中潜在的安全性风险。如何确保计算机网络技术在使用过程中的安全性和可靠性，杜绝计算机网络技术使用过程中的安全漏洞，是当前计算机网络技术领域在后续研发过程中必须持续思考的问题。本文将结合当下计算机网络安全的实际发展，针对计算机网

期刊

PLC技术在电气工程及其自动化控制中的应用探讨

摘要：现代社会的飞速发展使得我国经济水准越发提升，为电气工程及自动化控制提供了崭新的发展机遇，PLC技术的重要性在此种情况下越发显著。PLC技术本身所具备的抗干扰能力以及综合能力均非常高，因而能够被广泛应用在电气工程及其自动化控制中，能够发挥出极为可观的成效。下面，本文从多个角度着手，简要分析了PLC技术的基本概念以及其优势，同时针对性地探讨了其在电气工程及其自动化控制方面的应用，以求能够为相

期刊

地铁车站服务水平与提升策略探讨

摘要：地铁已成为城市发展的一种标示性设施，其能够促进国家经济建设，保障民生发展。同时地铁作为一种先进的交通设施必须要起到良好的带头作用，不断地强化车站的服务水平，继而吸引更多的市民前来光顾。本文主要对地铁车站的服务情况进行了详细的介绍，并对提升车站服务质量的对策进行了探究，确保其能够满足现代化市场发展的需求。　　关键词：地铁车站;车站服务水平;服务提升对策　　一、健全地铁车站的导向标识　　地铁

期刊

浅谈NFV的产生、发展及影响

摘要：随着云计算、SDN等相关技术的发展，对现有的网络提出了新的能力需求：网络具备高弹性、业务开通分钟级、网络部署更低成本等等。NFV技术它利用虚拟化技术，将传统架构分层解耦，重新按需编排，很大程度上满足了上述需求。NFV属于当前为缓和和解决各种行业问题而衍生的新技术，本文主要从NFV产生的行业背景，NFV的实现原理和系统架构，NFV后续的发展方向以及对行业的影响等方面进行阐述，希望能给读者提

期刊

关于电力变压器继电保护技术的应用与实践研究

摘要：经济的发展带动了我国电力的进步，电网规模逐渐扩大，有关部門为了保证供电安全，对电力系统的操作要求也在逐渐变高。作为电力系统中最特殊的设备部分，电力变压器能够进一步保证高低压电网系统的安全与可靠，能够对供电系统的正常运行产生极大影响。所以，及时勘察并排除外界干扰因素，进一步保证供电安全使用，不断探索发现，提高对电力变压器继电保护技术的研究是很有必要的。本文重点探讨关于变压器继电保护技术的应

期刊

基于角色的综合化配置工具的研究与设计

摘要：本文采用基于角色的配置方法，从不同开发者的角度出发，将各个开发商分为不同的开发角色，并为每个开发角色研制一套完备的配置工具。整个工具在Eclipse环境框架下搭建而成，共分为三个部分：前端配置、后台配置检查、后台配置生成。本文从开发角色的分类、开发角色各自关心的资源配置等角度出发，给出整个综合化配置工具的设计方案，方案通过使用XML Schema和XSLT结合的方式实现。　　关键词：角色

期刊

5G技术在移动通信网络中的应用

摘要：现如今，随着人们生活质量的不断优化升级，现有的网络速率似乎已经很难满足人们日渐提升的需求标准。本着技术优化升级才能长期存活的原则，5G技术应用而生。5G网络作为新一代移动通信网络，可以有效的满足现在及今后移动通信的需求。文章理论联系实际，对5G技术进行简单的概述之后，就SDN/NFV技术、D2D与M2M通信、移动云计算技术、超密集异构网络技术在移动通信网络中的应用进行了具体的分析，并就5

期刊

基于YOLOv3目标检测算法的驾驶员疲劳检测实现

与本文相关的学术论文