基于计算机视觉的驾驶员驾驶行为识别

来源 :湖南大学 | 被引量 : 0次 | 上传用户:huifentongxun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着汽车行业的发展,道路汽车数量逐年增长,道路交通事故已成为影响人民生活、社会安定的痛点。驾驶员行为是影响道路交通安全的重要因素。有效地识别驾驶员行为,并及时地进行警示,可以极大程度地避免交通事故的发生,从而保障驾驶员的安全。此外,在中低级别的自动驾驶车辆中,在自动驾驶系统失效时,驾驶员应当及时地控制车辆。实时地监控驾驶员行为,对于评估驾驶员接管能力,设计完备的自动驾驶决策算法大有裨益。因此,开展驾驶员行为识别算法研究具有十分重要的意义。针对自然驾驶场景下相机图像噪声大,数据类别样本不均衡,现有算法时空特征提取能力欠佳等问题,本文研究以人体骨架关键点为数据基础,利用深度学习方法充分融合时空特征,兼具准确性和实时性的驾驶员行为识别方法。本文主要研究内容如下:(1)针对现有开源数据集多为图片数据集,缺乏连续序列的上下文信息的问题,本文构建了驾驶员行为视频数据集。数据集由自然驾驶数据和模拟驾驶数据两部分构成。根据自然驾驶工况,设计模拟驾驶数据采集流程,在保证模拟数据可靠性的前提下,增加第二驾驶任务样本数量。利用AlphaPose姿态估计算法获得驾驶员骨架关键点信息,作为人体动作姿态表征,减少背景噪声干扰。通过迁移学习方法及时序指数平均滤波算法,提升AlphaPose算法回归精度,提高骨架关键点检测质量,为驾驶员行为分类算法提供数据基础。(2)研究基于长短时记忆神经网络(LSTM)的驾驶员行为识别算法。构建了结构简明的单层LSTM网络,并将各时刻驾驶员骨架关键点集作为网络输入,建立骨架关键点序列时序依赖关系。在驾驶员行为视频数据上对LSTM网络进行训练与测试,结果表明LSTM网络可以有效收敛,可基本解决驾驶员行为识别问题,但识别精度还需进一步提升。该网络将作为本文的基线模型,作为后续优化网络的对比基础。(3)提出基于时空图卷积循环神经网络的驾驶员行为识别算法。针对LSTM网络仅将骨架关键点集作为输入,缺乏关键点连接关系,难以充分表达人体姿态空间结构特征,设计时空图卷循环神经网络。根据人体结构设计驾驶员骨架图,构建五层图卷积网络,提取驾驶员行为空间结构特征。然后将各时刻空间结构特征输入至LSTM网络中提取骨架序列时间连续特征。此外,引入注意力机制,融合各时刻特征,以获得综合的驾驶员行为时空特征。针对驾驶员行为数据集样本不均衡问题,引入Focal Loss损失函数,自适应地平衡不同类别样本的损失值,优化网络训练过程。本文设计充分的剥离试验及交叉验证实验,结果表明,时空图卷积循环神经网络通过引入图卷积网络及注意力机制模块,相较基线模型具有较大提升。此外,与现有模型在同一数据集上的评估结果表明,时空图卷积循环网络具有更优的识别精度。实时应用实验中,时空图卷积循环神经网络也具有较好的计算实时性。
其他文献
近年来,汽车保有量快速增加引发的交通拥堵问题日益严重,信息通信、人工智能等新技术催生下的自动驾驶被科研人员寄予厚望。在工业界,各大车企和互联网公司纷纷加入“造车”热潮,自动驾驶的理论研究和商业化进程被推向了前所未有的高度。智能网联汽车将智能化和网联化的优势充分融合,通过车车通信形成的车辆队列系统,有助于提高交通流整体性能。车辆队列系统经过多年的理论研究进展显著,并在商业化进程中取得了突破。然而,现
羊具有很高的食用和使用价值。近年来,人们对肉制品、奶制品需求量的增加直接带动了畜牧业的发展,目前,规模养殖已经成为养羊业的主流。随着羊产业饲养密度的增大,羊病的发生率也在同步增长,病毒感染是导致羊患病的重要原因之一。羊病毒种类繁多,如小反刍兽疫病毒(Peste des petits ruminants virus,PPRV)、绵羊肺腺瘤病病毒(Jaagsiekte sheep retrovirus
AlxCoCrFeNi系高熵合金因其优异物理化学性能,使其成为研究最早、最广泛的一类高熵合金。作为结构合金,强韧性的平衡是重点。但由于高熵效应,合金通常具有简单的相结构,强韧性难以达到平衡:单相FCC合金通常强度低塑性高,单相BCC合金则相反。为此,双相FCC+BCC合金的研究成为平衡合金强韧性的研究热点。本文旨在采用激光增材制造快速制备具有高强高韧性能的AlxCoCrFeNi系高熵合金。通过元素
近年来,随着中国机器人市场需求快速增长,国家开始大力发展机器人产业,其中自主移动机器人成为当前机器人研究与应用领域的重要方向,也是机器人技术发展的必然趋势,而视觉SLAM是实现机器人自主移动的前提,通过知道自身在地图中的具体位置,便于实现导航和路径规划。本文主要对基于ROS系统的室内视觉SLAM技术进行研究,并给出相关实验进行验证,主要研究内容如下:(1)首先研究了相机模型的成像原理和RGB-D相
电力需求的增加和相关基础设施的升级与拓展,使得电力系统更加接近其稳定极限。电压崩溃引发的停电事故将会给社会经济造成巨大损失,电压稳定问题受到广泛重视,建立准确的电压稳定性指标具有重要意义。现有基于戴维南等值原理的电压稳定性评价指标,是将复杂系统等效为电势源与内阻抗串联的等值电路,通过比较戴维南等值阻抗与负荷静态阻抗的关系快速评估系统电压稳定性。但此类指标不能准确区分系统内部扰动与外部扰动对稳定性产
构件本构、截面本构和材料本构相关参数在模型更新中作为更新对象,通过参数识别修正更新而起到了提高混合试验精度的作用。在复杂结构抗震性能研究中,构件本构模型更新因仅能对构件参数相同的数值子结构进行更新而使其在实际应用中受到诸多限制。本文以构件本构模型更新为基础,提出了对照经验公式更新方法来完成框架结构中构件参数不同相似构件模型更新。该方法取物理子结构试验数据参数识别结果为识别值,取经验公式计算出的模型
随着信息技术的不断发展,以及各种能够支持定位的智能设备普及,许多互联网技术已经成为了人们的生活娱乐不可缺少的一部分。人们在享受使用这些相关软件设备时,不可避免的需要将个人的位置信息以及相关的隐私信息上传至服务器提高了隐私泄露的风险。因此如何保证用户的位置隐私安全的前提下又不影响基于用户个人位置的服务质量是位置隐私保护领域的研究热点。本文基于位置隐私泄露的问题进行了深入的研究。本文主要内容如下:1)
仿人灵巧手是机器人重要的末端执行机构,在服务型机器人、制造机器人和空间机器人方面都有着广泛的应用。目前面世的机器人灵巧手的应用场景较少,经过对国内外的机器人灵巧手进行分析发现,当今的机器人灵巧手仍存在体积过大、制造装配复杂、控制难度高、制造成本过高等问题。本文将针对以上问题,参考人手的解剖学原理中的手指骨骼、关节、手肌的构造与工作原理,结合人手协同的生物力学特征与运动统计学原理,保证满足资助项目需
20世纪上半叶的中国处于一个复杂、多元、兼容并蓄的时代,承受了外来势力、文化对本土政治、经济和文化的冲击,城市逐步向近代化发展和转型,中西文化的交流融合让城市及建筑等相关领域更具生命力和多样性。长沙近代建筑创作特征的演变深受社会变迁的影响。长沙20世纪上半叶有两个对建筑创作特征影响极大的时间节点:一是1904年长沙的开埠;二是1938年长沙的文夕大火。前者是西方建筑正式大范围涌入长沙的开端,后者是
随着经济的高速发展,社会对电力的需求日益增加,而近些年可再生能源发电技术快速发展,使得风电等新能源接入电力系统的比例越来越高。然而,风力发电功率具有高度的不确定性和波动性,这无疑给电力系统的安全与经济运行带来了巨大的负担。对于风电功率不确定性问题,目前已存在许多有效的方法,比如随机场景模拟、机会约束和鲁棒性优化等等方法。然而,这些方法都仅仅考虑了经济调度区间两端的功率平衡,忽视了风电功率短时剧烈波