运动多目标检测算法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:ahcyw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于深度学习的目标检测与识别技术随着研究的深入也早已进入到了工程领域,但目前被广泛使用的都是基于单帧的检测框架,这种框架能作用于单帧图像任务也能作用于多帧的视频任务。视频的检测与识别任务有一个特点,就是视频是由许多帧构成,前后帧在时间上是存在联系的,同一个目标在相邻帧上的变化存在着运动信息,这种运动信息的存在虽然会造成对焦模糊、运动模糊等现象,但若是能充分的使用这种运动信息,也能提升目标检测与识别的能力。故单帧的框架必然无法满足多帧的任务,如何能够利用相邻帧上的这种时间上的以及运动上的信息,是本文研究的方向。尤其是本文所使用的数据集是在无人机上拍摄的视频数据,使得检测与识别任务需要面对目标复杂等问题,同时由于无人机自身的运动导致画面出现抖动模糊的情况。本文所要解决的技术难题便是研究如何利用相邻帧之间的时间上的运动信息,来设计出相对于单帧框架拥有更好性能的算法,从而规避单帧框架的弊端,本文采用了两种不同的思路来设计算法,主要工作包括以下几个方面:首先,构建了基于记忆模块和交错模型的MG-SSD(Memory Guided Single Shot Multi Box Detector)目标检测与识别算法。由于在相邻帧上的特征表示往往相似,所以采用一种记忆的方式使用过去的特征来提高当前的检测结果是MG-SSD算法的核心理念。它将来源于循环神经网络中的LSTM与目标检测中的卷积层结合,形成这个检测与识别框架中的记忆模块。在此基础上,利用Bottleneck设计提升LTSM层的性能,使用Shufflenet单元代替一般深度残差网络中的Res Net单元来减少计算资源的消耗,并使用反卷积模块提升网络对中小目标的检测与识别能力。而交错模型的设计充分体现了利用时间信息的好处,利用精度优化网络保留的记忆,提升速度优化网络的能力。其次设计了基于光流特征传播和聚合的FG-FCN(Flow Guided Fully Convolutional Networks)目标检测与识别算法。与MG-SSD算法采用记忆模块保留一部分特征不同,FG-FCN利用光流网络预测出光流场,以此进行特征的传播和聚合的方式提升检测与识别的质量。其中在关键帧和关键帧之间使用了稀疏递归特征聚合,而在关键帧和非关键帧之间采用了空间局部特征更新。由于光流网络的性能也影响着整个算法,因此使用了空洞卷积和通道注意力机制来改进光流网络。另外还有设计关键帧调度算法,以及采用可变形卷积的R-FCN作为检测识别网络。最后,通过在无人机拍摄的数据集上比较了本文两种不同思路设计的算法在不同超参数的情况下检测精度以及检测速度上的差异,并与其他算法进行了对比。发现基于光流特征传播和聚合的FG-FCN算法在超参数较小的情况下精度高于基于记忆模块和交错模型的MG-SSD算法,但在超参数逐渐增大后,MG-SSD算法的性能渐渐优于FG-FCN算法,而且在总体上,MG-SSD算法的运算速度要快于FG-FCN算法。同时为了体现本文设计算法的泛化能力,通过在自采数据上进行了测试,表明本文算法的普适性,满足需求。
其他文献
在T市建筑产业转型升级的大背景下,本文简要论述了政府及其部门参与建筑产业转型升级的必要性,初步研究了协同治理理论及其对政府部门之间加强协同的应用价值,在此基础上提出了T市政府及各部门加强协同,共同推进建筑产业转型升级的对策和建议。本文按照“发现问题——理论研究——现状陈述——原因分析——提出对策”的基本思路开展研究。认真探究了协同治理理论的产生和内涵,概括出协同治理的定义,归纳出基于协同治理理论基
大型天线阵列被广泛用于雷达、预警机等系统中,天线阵列的性能会极大影响整个系统的性能,在军事和民用领域都发挥着重要作用。电磁场数值计算是分析大型天线阵列电磁特性的有效手段,但是精确的计算需要耗费巨大的存储资源和计算资源,因此对于大型天线阵列的仿真分析一直都是计算电磁学中极具挑战性的问题。目前,国内电磁分析数值方法大部分都是串行或工作站级的计算,对于大型天线阵列的精确高效仿真计算尚有较大的提升空间。针
目的:通过动态对比增强磁共振成像(Dynamic Contrast-enhanced MRI,DCE-MRI)定量参数的分析并与病理学对照实验,研究兔VX2恶性骨肿瘤实性区、微观浸润区及无肿瘤细胞区(单纯水肿区和邻近正常骨髓区)参数的差异,探讨DCE-MRI定量参数在评价恶性骨肿瘤髓内浸润中的价值。方法:纯种新西兰大白兔60只,建立右侧胫骨近侧干骺端VX2恶性骨肿瘤模型,3周后行常规MRI检查及D
LTE部署在非授权频段上不仅缓解了授权频谱数据流量压力,还可利用集中调度、干扰协调等技术提高频谱效率,提供更大的覆盖范围和更好的用户体验。但是,非授权LTE面临的核心问
研究背景心肌梗死(myocardial infarction,MI)是严重威胁人类健康的重要疾病之一。MI在欧美国家最为常见,在美国,每年约有0.05%的人口发生MI,且MI在中国的发病率近年来呈现出明显的上升趋势。MI危害在于可导致休克、心力衰竭、室壁瘤及心律失常等一系列威胁生命的严重并发症,尤以心律失常中的恶性室性心律失常(ventricular arrhythmias,VAs)的危害最为严重
随着经济的深化发展,市场交易量的不断提升,格式条款得到了广泛的运用。格式条款虽然能提高经济效率、节约交易成本,但亦存在诸多的法律问题。消费合同格式条款体现了经营者的利益需求,经营者将格式条款作为风险转移谋取利益的工具,其中必然涉及到对消费者权益进行限制、免除自身责任等不公平不合理的条款。虽然消费合同的内容与形式也跟随时代的发展而进步,但其中的格式条款却与消费者的需求渐行渐远。为有效保护消费者的合法
目的:利用氧化应激动物模型评价传统蒙药五根的水提取物和乙醇提取物的抗衰老作用。方法:选择健康的成年雄性Wistar大鼠,随机分为8组,每组8只。即空白组、顺铂(CP)模型组、阳性对照DHEA组(5.166mg/kg)、阳性对照qinaskul组(12.4mg/kg)、五根水提物低剂量组(497mg/kg)、五根水提物高剂量组(994mg/kg)、五根乙醇提取物低剂量组(43.736mg/kg)、五
在工程实践中,裂缝在隧道中是比较常见的病害,而且裂缝形式多种多样,其产生也是不可避免的。隧道裂缝产生的危害较大,这样就会导致一些安全隐患,例如检测人员存在人身安全隐
企业作为最基本的市场主体,其活跃水平在很大程度上决定着整个市场经济的发展水平。通过减少政府的行政干预,适当放宽企业设立的限制,降低投资者进入交易市场的门槛,促使企业
互联网媒体作为当前社会影响力最大的新型媒体,其特有的信息自由发布、广泛传播、信息海量等特点,为虚拟社会中内容安全管理提出了全新的挑战。实现对互联网上海量视频信息中