基于上下文信息的实时视频目标检测算法研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:ggx8829
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,视频监控在各种智能工业应用中起到日益重要的作用,如何高效地从视频中自动获取目标的有效信息就成为了一个很有价值的研究内容。研究者们提出了很多静态图像的目标检测算法,但是因为视频中存在大量的运动模糊、失焦、遮挡和奇异姿势等问题,会导致图像质量退化,所以静态图像的目标检测方法并不能很好地适配到视频目标检测中去。目前也有部分关于视频目标检测算法的研究,但大部分算法只是单方面的追求效率或检测质量,并且很多算法都使用了部分未来帧的信息,这在现实场景中的在线设备中是无法应用的。因此如何设计一个能够比较好的平衡检测质量和检测效率的在线视频目标检测算法,既有挑战性又对于真实场景的应用至关重要。本文从平衡检测质量和检测效率的角度出发,在特征提取网络的设计和上下文信息聚合的角度深入研究,利用深度学习的方法实现在线的视频目标检测算法。论文的主要工作有:(1)针对特征提取网络的设计部分,本文主要分析了网络在效率和效果上的问题,并分别针对这两个问题提出了优化方法。首先,针对通常使用的特征提取网络的参数量和计算量过大,从而拖延整个检测网络的效率,本文对特征提取网络部分进行了轻量化设计,主要使用分组卷积和1*1卷积构建的瓶颈结构减少特征提取骨干网络部分的参数量和计算量,并且针对FPN多级特征聚合进行简化,只使用四、五层和五、六层的特征聚合结果。通过该设计,本文的特征提取网络的FLOPs降低到了16.59G,相比VGG-16降低了1.4倍,相比Res Net-101降低了4倍,参数量也降到了10M左右。其次,由于经典的基于深度学习目标检测的特征提取网络基本照搬图像分类任务中的特征提取网络,更关注图像全局的信息,而检测则更关注局部信息,导致分类网络中特征提取部分的大感受野不能适配需要关注局部信息的检测任务。所以本文对特征提取网络结构进行了重新设计,平衡大目标和小目标的特征提取结果,并加入了特征金字塔网络(FPN)来对不同层的特征进行聚合。通过在静态图像目标检测数据集(Pascal VOC 2007)上进行对比实验,发现平均精度均值(Mean Average Precision,m AP)达到了78.36%,相比VGG-16提升了9%左右,在Pascal VOC 2012数据集上进行联合训练后,m AP值达到了81.53%。后续本文又针对检测主体部分进行了优化,加入了一些补充实验,优化后的m AP值最高达到了83.68%,相较VGG-16提高了14%左右。(2)针对视频相邻帧的特性,本文利用上下文信息对目标检测网络进行了两方面优化。首先,本文在特征提取部分加入了光流网络Flow Net 2.0,使用关键帧与当前帧的光流场对当前帧的特征图进行预测,省去一大部分的特征提取的计算时间,达到加速特征提取部分的目的。通过实验发现加入光流网络后,整个检测网络的FPS值达到了19.32,检测效率是原来的2.45倍,且m AP值只降低了2%左右。其次,针对相邻帧的信息相关性,本文在检测主体部分进行了优化。在RPN部分对关键帧和非关键帧的proposal进行聚合,提出了在语义层上对上下文信息进行聚合的轻量化方法。通过在Image Net VID数据集(ILSVRC VID 2015)上进行实验对比,m AP达到了77.4%,相较于原始模型提升了8.9%。本文又针对检测效率和检测质量的平衡提出了三种策略,在ILSVRC VID 2015上均达到了m AP值75%+,FPS值19+的效果,通过这三种策略可以在尽可能保证检测效果的同时有效提升检测的效率,以达到接近实时的效果。
其他文献
滚动轴承作为高速列车走行部的关键“关节”零部件,对保证列车安全平稳运行与列车人员的生命安全有着重要意义。在技术人员对于轴承实时运行状态更全面需求的日益增长与多传感器信息融合技术高速发展的大背景之下,传统奈奎斯特采样定理下采集到的冗余数据呈现爆炸式增长趋势。为此,本文提出使用压缩感知方法进行滚动轴承的早期故障诊断,该方法可在不拆解轴承的情况下对早期故障轴承做智能诊断,并能通过压缩感知软件的实现缓解数
随着5G的商用以及6G研究的推进,移动通信设备呈现爆发式的增长,同时,由于频谱资源天然的稀缺性,频谱资源管理的问题变得越来越突出。随着区块链技术的出现与迅速发展,区块链本身的去中心化、安全性等固有优势为未来的频谱管理提供了新的范式,因此基于区块链的频谱管理被视为6G的一个重要研究方向。目前国内外对于基于区块链的频谱管理的研究大多处于理论研究与仿真分析阶段,缺乏对基于区块链的频谱管理实测与性能验证。
进入二十一世纪以来,改善低收入城市居民以及新就业外来务工群体等“夹心层”的住房条件成为当代重要的民生问题之一。对此,我国积极制定适应民生的保障政策,各种类型的保障性住房应运而生。公共租赁住房是新型保障性住房一种,旨在提高我国“夹心层”群体的住房水平以及生活质量。与此同时,建设公共租赁住房所面临的诸多问题也随之显现。其中项目建设资金来源动力不足,政府财政无法全力支持项目落地完成是最为突出的问题。于是
我国公路运输业的持续发展,对我国道路交通安全提出了更高的要求。然而与发达国家相比,我国居高不下的道路交通事故率时刻威胁着人们出行安全和货物运输,严重制约着社会可持续发展。特别是随着我国道路交通基础设施建设重心由东部向中西部转移,长大下坡道路交通事故尤为严重,时常发生群死群伤,这已成为掣肘我国经济发展的“毒瘤”之一。因此随着我国公路运输车型重型化发展,研究长大下坡车辆行驶安全性显得尤为必要,尤其是重
随着人类科技的发展和生活水平的提升,能源紧缺渐渐成为人类共同关注的重大问题。传统化石燃料过度开采造成地球能源紧缺,并且带来了环境污染。氢燃料电池是一种新型能源装置,具备工作稳定、无有害气体及效率高等优点。燃料电池供氢系统负责供给燃料至电堆阳极,其氢气利用率低、压强差控制难度大及状态参数不易检测是提高燃料利用率和保证质子交换膜寿命亟待解决的关键问题。本文针对重型卡车的燃料电池氢气供给系统展开研究,主
缓倾顺层边坡在贵州地区多有分布,因其形成机理复杂、识别难度大,在地质灾害普查和早期识别中易被忽略,但缓倾顺层边坡一旦发生失稳破坏,其危害较大、后果严重,由缓倾顺层滑坡造成的灾害问题屡见不鲜,且导致的人员伤亡和财产损失严重,因此缓倾顺层边坡的失稳破坏机理、监测预警和风险评估已成为山区公路建设和运营中亟需解决的问题。本文深入挖掘和分析边坡现场工程现状和监测数据,剖析缓倾泥岩顺层公路边坡的影响因素,揭示
环境污染、资源短缺和气候变化等成为制约现代社会发展的重要因素,全球可持续发展问题愈发严峻。2015年联合国提出了17项可持续发展目标,确定了当前全世界的共同愿景和使命。工程建设消耗了大量能源资源,土木工程可持续发展对目标的实现具有促进作用。土木工程的各个领域必须向着更环保的方向发展。研究发现,桥梁的可持续性评价主要集中在经济和环境领域,对社会方面的关注较少,也很少有研究分析桥梁设计参数和社会影响之
真空管道运输(Evacuated Tube Transport,ETT)是一种以磁悬浮轨道技术为基础,构建管道形式的真空运行环境,实现列车零空气阻力、无摩擦运行的交通运输形式。目前国内外已经开展了ETT试验线项目研究,如国外Hyperloop项目和国内高速飞车项目。车地无线通信系统作为高速飞车运行控制系统重要的组成部分,承载了列车运行控制、运行状态监测等系统业务,与其他列控子系统共同保障了列车的安
随着科学技术和工业自动化水平的不断发展,列车运行速度也得到了一定的提升。道岔转辙机作为控制列车运行方向的核心设备,对其故障的精确和快速诊断是保障列车运行安全的重要基础。目前,铁路运维主要利用微机监测系统对道岔设备进行故障监测,系统报警往往对应了多种不同的故障模型,实际的排查仍是通过现场工人的天窗检测。为了保证设备的安全性,现场无法在转辙机内部安装传感器设备,这需要电务、工务工人不断进行信息交流,当
随着航空制造业的不断发展,对航空发动机叶片提出了越来越高的性能要求,对钛合金风扇叶片加工也提出了越来越高的精度要求。大量研究表明,叶片实际加工中,设置叶片加工参数对叶片叶型轮廓度误差有很大影响。因此,优化钛合金叶片加工参数是减小叶片叶型轮廓度误差的重要手段之一。本论文针对中国航空制造技术研究院叶片加工存在轮廓度超差的问题,基于数据挖掘技术中的统计分析法和决策树分类法进行了叶片加工参数优化,对减小钛