基于SSD的多因素融合的驾驶预警研究

来源 :昆明理工大学 | 被引量 : 0次 | 上传用户:gxblackjack
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汽车作为一种大众消费品早已进入千家万户,伴随着数量增加,安全驾驶的问题也变得越来越显著,其中危险驾驶行为给驾驶员和乘客都带来了极大的潜在危险和财产损失,由于危险驾驶行为具备隐蔽性和无意识性,需要借助辅助设备进行疲劳驾驶检测,故本文提出了综合多因素的驾驶行为评判标准,在一个网络框架下实现了多任务的融合,实时准确且便于移植,该系统的应用对于驾驶员的安全驾驶,智慧城市的推进都具有重要意义。现阶段的危险驾驶预警系统大多是基于单一因素判断,比如根据眨眼频率或头部姿态,容易受外界因素的干扰造成误检或漏检难以全面地对驾驶员的驾驶情况做出准确的判断。即使是多因素判断系统,也是由多个单因素判断网络串联而成的,模型不仅体积巨大难以达到实时检测,还给后期系统的移植和维护带来了不便。本文基于SSD网络提出了一种新的基于综合多因素的危险驾驶行为评判标准,结合了头部姿态、眨眼频率、眼睛与嘴巴的PERCLOS值以及打哈欠等因素对驾驶员的驾驶情况进行综合的评估;在原有的SSD基础上用Mobile Net V3替换原主干网络,速度提高了21.7%,准确率提高5.9%;构建了新的检测器,将目标分类、目标定位、头部姿态检测等多重任务进行融合,避免了多模块拼接造成的误差累计以及各模块对图像重复的特征提取,提高了系统的鲁棒性,便于后期跨平台移植;根据应用场景的需要改进了输出端的非极大值抑制层(NMS),直接输出每个类的置信度最大的检测框,省去了检测框之间重叠度(IOU)的计算和置信度阈值的设定,改进后检测速度相较于置信度阈值为0.1时的检测速度提高了近40%;对比了应用场景下检测目标的图像大小与特征层上每个特征单元对应的图像大小,更改了特征层的抽取层数和默认检测框比例,在不降低检测精度情况下使模型生成检测框的个数从八千多降到了两千多个,减少了模型计算量;为保留图像的几何比例信息对输入图像做最大内切正方形裁剪处理,避免了非正方形图像在缩放过程中产生的扭曲;训练集使用关键点生成坐标框的方法,搜集并整理了四万余张训练图片,充分的利用了现有的数据集并省去了繁琐的人工标注过程;对Mobile Net V3权重网络进行迁移学习,训练过程采用前期全面训练和后期局部微调相结合的方法,加快了模型收敛速度。整个模型在单卡2080Ti上的检测速度可达41fps,系统体积仅有34.7M,便于在移动端的部署以及跨平台的移植。此外,本文还比较了眼部图像在不同方向上的一维投影,发现眼部图像在x轴投影的方差值变化与眼睛开合度变化呈明显线性相关,可以通过一维投影的方差变化得到眼皮的运动信息,记录了不同个体在闭眼过程和睁眼过程的方差变化序列,通过对比正常状态下和模拟疲劳状态下的眼动速率,提出了一种新的基于眼动速率的疲劳判别方法,即当头部姿态相对固定时闭眼过程x轴投影方差变化速率的值连续两次低于0.06即可认为驾驶员存在疲劳驾驶的可能,该方法与本文第三章的网络模型结合不仅能监测眼睛的开闭状态,同时能够检测眨眼过程中的眼动信息,根据眨眼过程中的眼动速率可将系统预警所需的时间由分钟级别的频率监测提升到以秒为单位的速率监测,预警时间的大幅前置对于汽车高速行驶时的安全驾驶具有重要的意义,同时把图像的二维几何特征转化为一维光学特征,使计算量呈指数级下降,该模块检测单帧眼部图像耗时仅约为0.001秒,准确率可达91%,在保证结果准确的同时几乎不增加额外的计算开销。
其他文献
钢水碳含量终点预测作为转炉炼钢重要的一环,准确的预测将直接关系到炼钢效率,有利于减少能源和原材料浪费。由于熔池内不同比例的钢水碳含量能够反映在炉口火焰颜色、纹理形态等信息的变化上,因此采用炉口火焰图像特征提取的终点碳含量预测方法为传统预测提供一种新的参考,但火焰作为一种复杂变化的非结构对象,具有较强的随机性和相似性,给特征提取带来不小的困难,进而影响到终点预测的准确性。针对上述问题,本文将从钢水碳
转炉炼钢生产过程中,终点碳温的准确预报是钢铁产业至关重要的一环,而碳含量的准确预报对于提高钢铁冶炼工艺具有重要的意义。本文针对转炉终点炉口火焰图像相似性高,传统特征方法难以提取区分碳含量相近的火焰图像的关键特征,从炉口火焰图像的颜色特征和纹理特征提取入手开展研究,为提高基于炉口火焰图像特征提取的转炉炼钢终点碳含量预测准确率打下基础。本文的主要研究内容如下:(1)采用基于卷积神经网络火焰特征提取的终
行人重识别是一种利用计算机技术判断摄像机收集的视频或图像中是否存在特定行人的技术,可以自动地对多个不交叉摄像机捕捉的行人图像进行匹配,因而在智能监控系统中发挥着显著作用。但现有的大多数行人重识别方法是在单个有标记数据集上进行训练和测试的,如果在源数据集上训练的模型直接应用到目标数据集上会产生因行人图像风格差异等因素引起的域偏移问题,从而导致最终的识别精度很低。现实场景中已标记的行人样本是极度缺乏的
在当今信息时代的背景和进程下,作为信息技术载体和媒介的印刷电路板(Printed Circuit Board,PCB),从我们日常生活中经常接触和使用的手机、电脑等各类电子产品,到军事中的飞机、卫星等领域都有着广泛的应用。由于工业生产中对PCB更高的要求加之现在的电子产品高度的集成化,PCB板的生产更加细化、走线结构更加复杂,从而导致PCB板带有缺陷的概率大大提升。PCB板必须保证线路连接、线距以
纤维结构是存在于太阳色球层中的一种呈现出喷射状态的线性拉长结构,研究色球纤维的动力学特征能够帮助人们对太阳大气质量平衡以及针状体的演变过程进行更进一步的研究。进行纤维结构动力学特征的研究的前提是对太阳色球纤维进行准确的识别和提取,因此选择一种高效准确的识别方法是当前人们的关注重点。在进行色球纤维识别前,我们首先对纤维图像的特点进行了分析研究,发现当前纤维识别的难点以及存在的问题仍然有许多。因为在色
预测和推理未来结果的能力是智能决策系统的关键组成部分。近些年,以深度学习为代表的机器学习预测算法取得迅猛发展,广泛应用于天气预报、自然灾害预警、疾病诊断等领域。然而,在太阳光球磁场演化研究方面,由于缺乏完备的数据集和全面的评价标准,以及演化过程中存在磁结构运动、形变、浮现、消失等多种复杂变化交织的问题,使得直接在时间和空间上预测磁场的演化过程具有较大挑战,所以目前尚无对太阳磁场的演化过程进行预测研
随着我国网络技术普及度的加深,网络社交媒体中产生了海量的带有情感色彩的文本数据。研究者们根据情感表达中是否含有情感词,将其分为显式情感表达和隐式情感表达,由于我国网民更倾向于通过含蓄的方式来表达情感,所以中文的隐式情感表达数量非常庞大。对这些海量的隐式情感表达进行分析,是情感分析研究中不可或缺的重要部分,在舆情分析、升用户体验以及改进服务和产品质量方面,具有广泛应用场景和重要研究意义。本文对源自社
随着电子商务的快速发展,服装市场的潜在价值也在逐步显现,针对服饰检索、服饰识别和服饰推荐等计算机视觉领域的研究出现一系列研究任务。我国有55个少数民族,民族服饰种类繁多,服装结构复杂,语义属性丰富,能够将服饰图像检索技术与民族服饰文化相结合,对民族服饰实现数字化,这对传统民族文化保护具有重要意义。民族服饰图像具有不同民族风格的服装款式、配饰和图案导致的民族服饰图像细粒度检索准确率较低的问题,本文提
近年来,法院工作已经成为互联网媒体和舆论关注的焦点,来势汹涌的网络舆情给法院工作造成了巨大的压力。面向案件微博评论的情绪分析有助于法院等相关部门及时了解和掌握案件微博舆情,然后进行舆情监控和传播引导。面向案件微博评论的情绪分析属于特定领域的任务,存在没有公共数据集、情绪表达具有领域性等研究问题,值得深入研究。本文研究面向案件微博评论的情绪分析方法,主要从以下几个方面开展研究:(1)案件微博评论情绪
金属作为制造业的支柱产品之一,金属的质量优劣影响着终端产品的质量。金属表面缺陷检测是金属质量控制的重要一环。金属的表面缺陷检测中,基于机器视觉的检测技术已经成为主流。机器视觉本质上是模仿人类视觉系统,现在表面缺陷系统中硬件设备已经较为成熟,因而图像处理技术成为研究重点,其性能决定着整个缺陷检测系统的性能。金属表面缺陷图像存在着,缺陷和背景对比度低,缺陷类型和尺寸差别大等问题,同时还存在高光和阴影干