基于最大光流差异关键帧的交通事故识别

来源 :山东大学 | 被引量 : 0次 | 上传用户：sxz123123

【摘要】

：

【作者】

：

宋子坤

【机构】

：

山东大学

【出处】

：

山东大学

【发表日期】

：

2023年01期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

由于交通事故行为在真实环境下表现为类型复杂,行为发生的时间跨度较大,产生的时间跨度却极小。通常来说,产生交通事故的小片段对于交通事故是否发生具有重要意义,在构造深度学习张量之前精确的定位这些小片段会提高行为识别模型的准确率。同时,行为识别模型中时间维度的额外引入带来了高昂的计算代价,特别是以3D卷积为基础的深度学习模型。在构造3D张量时,张量时间上的维度会远小于视频本身,视频中稀疏的交通事故行为无法保证蕴含其中。采取传统采样方式构建深度学习张量难免会引入与交通事故行为不相关的视频帧,以此丢失信息,影响识别精度。为了解决这个问题,本文提出了一种基于光流估测的3D张量构建方法,使用视频序列的关键帧构造张量。与一般基于视频内容的关键帧不同,我们定义的关键帧是视频序列中角色或者物体运动变化过程关键动作所处的节点,可以表征行为的关键信息。针对交通事故行为特性,我们首先通过最大光流差异捕获视频中的关键帧,产生多个候选关键帧张量,然后使用一个两阶段的类EM方法从候选关键帧张量中提取出关键帧张量,随后在SGD的反向传播过程中基于关键帧张量更新模型参数。保证了视频序列关键信息不丢失,深度学习模型精度不下降。我们还扩展了已经在2D卷积神经网络取得重大成功的深度可分离卷积和注意力机制到行为识别模型,使用3D深度可分离卷积和时空注意力机制分别从模型复杂度和模型表达能力两方面进行模型优化。我们的实验证明,基于关键帧的视频行为识别在F1得分为0.772的情况下实现了76.3%的准确率,对比一般行为识别方法可以使交通事故数据集在性能上得到极大的改善。我们利用扩展的3D深度可分离卷积,时空注意力机制分别应对低延迟,大数据集等其他场景,产生了一套行为识别较为完善的解决方案。我们的方法针对行为识别采样问题,其中的关键帧提取技术与传统基于最小光流差异的关键帧提取技术恰恰相反,是一种实现交通事故判别实用化和产业化的新颖方式。

其他文献

融合人工智能和物联网技术的安全工器具智能管理装备

安全工器具在电力系统运行中具有着无法替代的作用，其是保障人员操作安全的关键。文章通过分析物联网技术与人工智能技术融合特点，进一步分析了基于两种技术结合应用的安全工器具智能化管理。

期刊

绿色投资基金效率评价及其持续性研究

绿色投资基金为广大投资者参与绿色投资提供了渠道,因此拥有广泛的社会资金来源,这为绿色项目的立项与发展给予了重要支撑。传统的基金绩效评价方法仅关注经济效益,忽视了绿色投资基金的环境效益。本文试图建立一个能够兼顾经济效益和环境效益双重标准的评价体系,对我国绿色投资基金的效率进行更为全面合理的评价。本文在国内外基金绩效评价相关研究的基础上,根据我国发展实际,选取了2018年以前成立的29只绿色投资基金,

学位

基于自监督相互关系学习的跨模态检索研究

近年来,随着移动互联网和社交媒体平台的发展,文本、图像、视频等多媒体数据迅速增长,用户不再满足于单一模态的检索进而对不同模态间数据检索的需求不断增加。为了实现不同模态数据之间的相互检索,跨模态检索方法应运而生。跨模态检索将一种模态的数据作为查询去检索其它模态中语义相似的数据。由于其广阔的应用前景,近年来受到研究人员的广泛关注。目前,大多数跨模态检索的工作利用跨模态数据的语义标注作为监督信息进行跨模

学位

马克思恩格斯生态伦理思想及其当代价值研究

自从人类社会诞生以来,人与自然之间就产生了千丝万缕的联系。当历史的车轮推进到工业文明阶段,人类征服自然、利用自然的需求与欲望不断增强,导致环境污染和生态危机日益加剧,重新审视人与自然的伦理关系成为当务之急。本文以马克思恩格斯生态伦理思想的理论渊源与形成过程为出发点,系统阐述了马克思恩格斯生态伦理思想的理论内涵,并在梳理马克思恩格斯生态伦理思想在中西方的传承与发展的基础之上,具体探讨了马克思恩格斯生

学位

天然乳脂不同加工改性方法及物化特性评价

乳脂作为乳中重要的组成成分,是乳制品中主要的能量及风味来源。然而,国内对于乳脂的研究起步较晚,现有的乳脂产品较为单一,无法满足工业化食品加工的需求,严重限制了乳脂产业的发展。因此,本研究通过分级分提、短程分子蒸馏及酶解等改性方法对乳脂进行一定程度的分离,并分析经过不同改性后乳脂组分的物化特性变化,为研发不同需求的乳脂产品提供理论指导。实验具体结果如下:首先,采用干法分提的方式对乳脂进行改性,并研究

学位

电针在Ⅰ型腹股沟疝术中镇痛效果临床观察及对β-内啡肽表达影响的研究

目的:本研究通过临床随机对照试验设计,旨在评价电针在Ⅰ型腹股沟疝术中镇痛效果,并对术前术后患者血浆中的β-内啡肽（β-EP）含量采用ELISA法进行实验室指标检测,观察电针对β-EP表达的影响,为推广临床应用及进一步探索研究打下基础。方法:根据纳入和排除标准,选择2020年09月-2021年09月期间,在南京中医药大学附属南京市中西医结合医院普外科住院接受开放手术治疗的Ⅰ型腹股沟疝患者60例,所有

学位

基于角点网格的地层中等值线的生成方法

等值线图作为数据可视化的传统手段,在石油勘探、采矿、地球物理和气象预报等诸多领域中应用广泛。地质研究表明,从复杂地质中准确计算断层区域对发现石油与天然气等资源有重要的指导作用。本文旨在研究在存在断层的情况下如何追踪地层内部的等值线,辅助定位油气资源的聚集区域。使用等值线图提取地层结构是地质结构研究的重要手段,但当断层相交、断层类型不一致等复杂地层出现时,传统的等值线计算结果很难满足实际需求。本文针

学位

多类别物体点云模型的结构点预测

三维形状的结构分析是三维视觉领域内的重要研究内容,在机器人抓取和场景理解等方面具有非常重要的应用。随着激光雷达等设备的逐步成熟和点云扫描技术的不断发展,点云数据也得到了越来越广泛的使用。因此,点云的结构分析与理解成为一个重要的研究问题,而预测关键点或者结构点是解决这一问题的有效方式。二维图像中的许多关键点检测技术都已经成功移植到三维点云模型上来,比如SIFT算子和Harris角点等。SIFT算子预

学位

面向纠错的知识蒸馏研究

图像分类作为计算机视觉领域中一个极其重要的基础任务,一直受到国内外学者的广泛关注。近年来,深度神经网络凭借其强大的学习能力,已逐渐成为解决图像分类任务的主要技术路径。然而,随着对图像分类的精度要求越来越高,深度神经网络的模型结构变得越来越复杂,参数量也随之越来越大,这使得深度模型的实际落地应用受到了极大的限制。针对上述问题,以知识蒸馏为代表的模型轻量化技术应运而生。虽然现有的知识蒸馏方法取得了显著

学位

基于多视图的3D形状分类方法研究

随着数字设计、虚拟现实、计算机游戏等技术的快速发展,3D模型的数量和规模在各类业务中呈现快速增长。3D形状识别和分类是进行形状理解、智能设计、模型检索以及提高人机协同效率的基础。因此如何使计算机快速准确完成对大量3D形状的识别,成为计算机图形学领域的研究热点。深度学习近年来在众多领域取得重大进展,人们也将其应用到3D形状分类任务中。但3D形状数据并不是一种欧氏数据,这与深度学习的基本计算方法相冲突

学位

基于最大光流差异关键帧的交通事故识别

与本文相关的学术论文