基于多层特征融合的视频目标检测

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:hong2007quan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测的任务是从图像中识别感兴趣目标的类别并用检测框标记其大小和位置,随着深度学习的广泛应用,目前对于图像目标检测的研究取得了巨大的进步和成果,近年来人们开始研究对视频的目标检测方法。视频是由一系列连续图像组成,其图像之间存在一定的映射关系,视频在提供更多前后文时序信息和空间信息的同时,其场景的变化也增加了许多挑战,如:目标遮挡、运动变形、光照模糊等。如果将图像目标检测方法直接用于视频的目标检测,不仅速度慢,而且效果差。所以,如何利用视频数据提供的前后信息和冗余信息,在保证检测速度的同时,解决视频目标检测中出现的漏检、误检、检测框不精准等问题是目前视频目标检测研究的重点。根据如上描述,本文做了以下三点工作。第一点,针对提取图像卷积特征时丢失部分细节信息的问题,本文提出了基于两次特征融合的视频目标检测方法。第一次特征融合是在提取图像卷积特征时,融合其浅层、中层、深层卷积层的特征图对最终表征图像的特征图进行信息增强,保留深度语义信息的同时增添目标的轮廓、纹理等细节信息。第二次特征融合是对当前检测帧图像的特征图融合其前后帧图像的特征图,目的在于对检测帧图像出现遮挡、变形、模糊等问题时进行特征增强,补全缺失信息。第二点,针对视频帧图像中背景过于复杂时对前景目标信息的影响,本文提出了基于注意力机制融合特征的视频目标检测方法。利用注意力机制的选择功能,增强图像特征图中目标特征的显著性,使模型重点关注特征图中用于目标检测的关键信息。同时,利用注意力机制设计特征融合时的人工规则,减少网络计算量的同时提高特征融合的效率和准确率。第三点,针对多类别目标检测过程中相似目标的相互干扰,本文提出了基于多模型特征融合的视频目标检测方法。利用多个子模型分别学习相似目标的特征,再并联这多个子模型的特征处理部分,使用注意力机制对并联特征进行选择和综合用于整体模型对数据集进行二次学习。这种对复杂任务进行分解处理的做法可以降低多类别目标的识别误差,提高检测的精准率和召回率。上述本文的三个工作点,在公开的ImageNet VID数据集上进行验证都取得了比原始方法更好的结果,其检测速度和精度都得到了不同程度的提高。
其他文献
命名数据网络,Named Data Networking(NDN),是以内容为中心的网络架构中最有代表性的一员。NDN改变了传统IP网络的传输模式,它利用路由节点可以存储数据的特点,实现了分布式
新时代我国教育研究的主要命题是核心素养的培养。作为生物教学最重要的教学方法之一,探究教学在培养学生科学思维、科学探究素养等方面有巨大优势。但近年来,探究教学面临的
本文首先从我国水资源现状和常规水处理工艺技术的背景出发,综述了臭氧在水处理中的应用现状。臭氧因为其具有强氧化性及消毒作用而经常被用于水处理技术中。另外,由于臭氧氧化具有选择性的特点,臭氧化法也经常应用于某些有机物的选择性合成中。基于单独臭氧化法的缺陷和实际应用的需求,结合固体碱(MgO)的特性,提出了本文的研究内容。本论文主要分为两个部分:MgO/GF催化臭氧化降解双酚A的研究;固体碱MgO催化臭
曲线建模在计算机图形学中有着悠久的历史。曲线建模的基本目标是构建具有良好几何性质且易于编辑的自由曲线。工业设计领域中一个重要的问题是怎样构建光滑(或光顺)的自由曲
软件定义网络(SDN)得到了越来越多的关注和应用,这主要得益于它和传统网不同的特性,传统网络采用协议分层的机制,每一层只负责和自己相关的工作,SDN打破了分层的结构,主要有控制逻辑和转发处理逻辑。控制逻辑由控制器来实现,转发处理逻辑由交换机负责,此外SDN还支持编程特性,在控制器中可以编程实现新的功能,然后将相应的规则下发给交换机,控制器负责路径发现,负载均衡等功能,而交换机只负责相应报文的处理和
亲属容隐制度,作为我国法制史上一项具有浓厚人伦色彩的制度,在古代表现为亲亲相隐原则。其含义是允许一定范围的亲属之间互相隐瞒罪行,不以犯罪论处。亲属容隐制度作为一项
随着网络和通信技术的发展,移动用户设备(User Equipment,UE)的爆炸性流行加速了许多延迟敏感且计算密集的应用程序和服务的出现与发展,UE的计算、存储和网络等资源的管理优
随着国家利益拓展和“一带一路”国家战略的实施,国民经济建设和军事国防对境外高精度地理信息需求越来越迫切,依靠光学立体测绘卫星采用无控测图技术是获取境外地理信息的有
高等教育大众化改变了传统精英教育模式,高等教育数量及规模蓬勃发展。然而,发展不仅仅是数量扩张的过程,也是教育质量不断提升的过程。如何监控与提升高等教育质量一直是高