引入定位信息和随机贪心采样机制的目标检测研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:leolee19820604
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是计算机视觉领域的基础任务之一,在与视觉相关的许多下游任务中都有重要的应用。除要求目标分类性能好,目标检测任务还要求目标定位精度高,而这点被学界关注得不多。另外,从实用性角度看,还常常希望模型的训练时间短。本文以经典的Faster R-CNN两阶段目标检测框架为研究对象,系统分析导致定位精度不足和训练速度慢的原因,并提出针对性的改进策略,主要研究工作如下:(1)当前目标检测模型中的主干网络主要用Image Net的图像分类数据进行预训练,因此其得到的特征较适用于目标检测的分类子任务,而与目标检测的定位子任务不够匹配,从而影响了目标的定位精度。针对此问题,本文提出引入定位主干网络的目标检测算法。在原有的特征提取主干网络(简称分类主干网络)的基础上,本算法设计和增加了一条并行的适用于提取定位特征的主干网络(简称定位主干网络),并将这两个网络提取的特征分别用于目标检测的分类和定位子任务,从而提高目标检测的定位精度,并达到提升目标检测整体性能的效果。(2)上述算法中分类主干网络依然来自图像分类数据的预训练,提取的特征常包括很多背景信息,对分类子任务本身也有负面影响。针对此问题,本文提出基于定位注意力机制的目标检测算法。本算法用定位主干网络提取的特征生成注意力权重,用于帮助分类主干网络更多关注目标本身,使所提特征包含更少的背景信息,提升分类子任务的性能,进一步提升整个目标检测的性能。(3)目标检测模型的训练通常需要较大的数据集,导致训练时间长。一个根本的原因是:训练过程中不考虑数据包含的信息,完全随机从数据集中采样样本用于训练。根据此分析,本文提出基于随机贪心采样的目标检测训练算法。本算法在每轮训练开始前,通过改进的信息量预测模型估计每个数据的信息量;然后将数据集随机划分为多个子集,再设计一种双信息量准则从每个子集中选择样本用于训练。这样既考虑了样本所包含的信息,又蕴含随机采样思想保持了样本的分布,使得模型的训练速度得以提升。本文在Pascal VOC和MS COCO两个经典的公开数据集设计和进行了一系列的实验,实验结果充分验证了上述所提算法的有效性。
其他文献
船舶的动力机械会在运行中产生各种振动,通过对振动信号的分析,既可以判断船舶是否存在故障,又有助于减小船舶振动以提高船舶寿命以及隐蔽性,在分析振动信号前首先要对振动信号进行采集,然而采集过程中会将环境噪声以及采集系统内部噪声混入振动信号中,需要使用降噪处理手段去掉混入振动信号的噪声,因此设计一个船舶振动信号采集与降噪处理系统具有重要意义。本文基于对系统功能和指标需求的分析,设计了系统总体方案并对系统
学位
现实世界中的典型应用例如智能电网、无人机群等都可以描述为多智能体系统。近年来,多智能体系统理论正在被广泛应用于工业生产、信息通信等现代领域。其中,多智能体的同步和编队问题,由于在无人机编队、无人艇编队方面的应用前景,一直是学术界的研究热点。分布式控制是多智能体系统中不依赖中心节点的控制方式。由于不需要中心节点,它可以降低系统的成本,提高系统抗干扰的能力。本文围绕多智能体系统的同步和编队问题展开分布
学位
多机器人焊接系统由于其工作范围大、生产效率高,在大型制造企业得到了广泛应用。焊接机器人的运动可分为两部分,即在任务点完成焊接的工艺运动和遍历所有任务点的任务运动。工艺运动路径是工程师根据焊接工艺要求设定的运动路径。任务运动路径实现机器人快速、安全地遍历所有任务点,直接影响系统的生产效率和安全性。多机器人焊接路径规划问题复杂,涉及任务分配、遍历规划、避障运动规划,现有方法难以对路径高效、负载均衡、系
学位
学位
无人艇是指船端无人操控且具备远程遥控与自主航行能力的水面船舶,以无刷直流电机作为原动机的推进系统能有效减少无人艇对环境产生污染,推进无人艇在内河湖泊的应用。位置传感器是无刷直流电机换相的主要依据,同时也是硬件故障的重要来源,因此,采用无位置传感器控制方式能够显著提高驱动系统的可靠性,更适合无人艇应用。因此本文选题研究面向无人艇的无传感器无刷直流电机控制,具体研究内容如下:本文首先建立了无刷直流电机
学位
本研究以统编初中语文教材及初中语文教学为例,分析文化自信视域下中华优秀传统文化的教学路径。中华优秀传统文化是初中语文教学的重要内容,文化自信作为首要的语文核心素养对中华优秀传统文化的教学有重要的指导意义。在文化自信的指导下开展初中学段语文中华优秀传统文化教学,教师可采用融入多元要素、创设生活情境、回溯历史经验、激发创新意识等教学方法,促进学生持续认知中华优秀传统物质文化、增进学生深入理解中华优秀传
期刊
无人机自主导航技术通常以GPS定位为主要手段精准获取位置信息,被广泛应用于交通、国防建设、抗灾救援等多个领域。而下视景象匹配技术可以在GPS信号弱或受到干扰时对无人机进行自主定位,以保障无人机的安全。传统的下视景象匹配方法受制于机载硬件性能的限制,仅能通过提取图像的低维特征进行匹配,匹配精度受限,且无法适应低信息量、低稳定性以及具有重复模式的匹配区域。而深度学习优秀的特征提取能力能够一定程度弥补传
学位
在地铁牵引系统中,为减少逆变器产生的谐波,往往在直流侧电压源和逆变器之间安装滤波电感和支撑电容作为滤波器。但由于逆变器直流侧存在负阻抗特性,其与滤波器相互作用降低系统稳定性。因变流器受空间、重量等条件限制,滤波器参数的选型往往难以满足系统的稳定性要求,在牵引变流器—电机系统处于功率较大的牵引工况时,直流侧电压将出现持续振荡,影响逆变器对电机的控制。因此,本文的主要内容为分析地铁牵引系统中母线电压振
学位
复杂战场环境下敌方战机多为亚像素目标,无形态信息。干扰、假目标等与真实目标形态相似,仅从图像上难以区分。光谱中含有目标的不变特征,是目标识别的重要依据。运动目标的光谱获取较为困难,通过红外图像重构目标的红外光谱,为目标识别任务提供光谱维度的信息,是提升目标识别准确率的重要手段。本论文针对红外光谱重构过程中单波段成像信息量少、用于重构的信息维度低,以及大气红外辐射干扰严重的问题,提出了多波段关联的红
学位
<正>民俗文化是一个民族在千百年的发展过程中流传积累下来的一笔宝贵财富,是历史沉淀下来的文化精髓,是中华民族文化的一朵奇葩,它承载着民族独特的传统与丰富的文化内涵。源远流长的民俗文化已成为语文课程资源的重要组成部分,其对培养学生的学科素养和思想情感有很大的促进作用。把优秀民俗文化融入语文教学中,不仅能让学生更好地了解民俗的相关知识,感受其魅力,还能更好地激发他们的民族自豪感,增强他们的文化自信。
期刊