基于深度学习的单发多框检测器优化算法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:meiaihui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测作为计算机视觉的基础任务之一,为解决分割、场景理解和目标跟踪等更复杂或更高层次的计算机视觉任务奠定了基础,它在包括机器人视觉、人机交互和自动驾驶等人工智能和信息技术领域有着广泛的应用。随着深度学习技术的发展,基于深度学习的目标检测算法取得了较大的进展,单发多框检测器(Single Shot multibox Detector,SSD)是一种在简单性、快速性和准确性之间提供最佳权衡的目标检测算法。本文选择SSD算法作为基础开展研究,考虑该算法存在小目标检测不够鲁棒以及训练过程中样本和多任务不平衡等问题,对如何提高SSD算法的检测性能进行了深入研究并提出了三种有效的解决方案。本文主要工作内容如下:首先,在详细介绍了SSD算法的网络结构和原理的基础上,针对其网络结构中检测层单一的利用方式导致特征信息使用不充分的缺点,提出了一种基于双向特征融合改进的单发多框检测器算法(Two-way Feature fusion based Single Shot multibox Detector,TFSSD)。TFSSD算法利用提出的双向特征融合模块(Two-way Feature Fusion Module,Tw FFM)对传统检测层进行特征融合以生成包含丰富几何细节和语义信息的新检测层。公共数据集上进行的一系列对比实验充分验证了Tw FFM和TFSSD算法的有效性。其次,为进一步挖掘检测层的特征信息,提出了一种联合注意力单元(Joint Attention Unit,JAU)。通过将JAU嵌入到传统检测层后,提出了一种基于注意力机制改进的单发多框检测器算法(Attention based Single Shot multibox Detector,ASSD)。JAU由缩放点积注意力(Scaled Dot-Product Attention,SDPA)和挤压激励模块(Squeeze-and-Excitation Block,SEB)组成,可以从空间和通道两个方向充分挖掘检测层内的相关性信息以获取更加重要和关键的信息,进而指导模型优化。在公共数据上进行的一系列实验结果表明,JAU是有效的,ASSD算法也比SSD算法的准确性更高。最后,针对目标检测训练过程中存在的多任务和样本不平衡问题,提出了一种更平衡的L1损失(More Balanced L1 Loss,MBL),并进一步提出了一种基于更平衡损失改进的单发多框检测器算法(Balanced with Two-way Feature fusion and Attention based Single Shot multibox Detector,BTFASSD)。BTFASSD算法利用已有的双向特征融合模块Tw FFM和联合注意力单元JAU构建整体的网络结构。BTFASSD算法首先利用Tw FFM对传统检测层进行特征融合,随后进一步利用JAU来对检测层进行重点特征信息挖掘,最后MBL则在训练过程中通过调整难易样本梯度贡献的权重来促进关键梯度的回归进而实现更均衡的训练。公共数据集上一系列的对比实验表明,BTFASSD算法进一步提高了SSD算法的精度,尤其是小目标检测的性能。
其他文献
目的:探讨肿瘤相关小胶质细胞/巨噬细胞通过TGFBI调控胶质瘤干细胞异质性和促进胶质母细胞瘤恶性进展的可能作用及其机制。方法:本实验以NCH-421K人源胶质瘤干细胞以及GBM标本为研究对象,结合TCGA、Rembrandt、Oncomine等开源肿瘤数据库,以及rhTGFBI刺激前后NCH-421K细胞RNA-seq结果,通过以下方法,探究肿瘤相关小胶质细胞/巨噬细胞通过TGFBI调控GSCs瘤
自广义相对论建立以来,寻找爱因斯坦场方程的解一直是理论物理乃至数学领域一个非常重要的研究课题。由于爱因斯坦场方程的高度非线性,寻找解析解存在着一定的困难,数值相对
外骨骼机器人是智能设备的一种,主要是通过模拟正常人的运动方式帮助下肢瘫痪的人实现行走的能力。外骨骼机器人集传感、控制、信息、移动和计算于一体,其功能的实现是通过多
目的:在超细晶纯钛表面制备出表征及物理性能良好的TiO_2-HA复合膜层,并获得较佳的制备参数,为超细晶纯钛在口腔种植领域应用提供实验依据。方法:将一定规格的超细晶纯钛及普通纯钛试件,进行微弧氧化处理,微弧氧化电压为400V,频率为500Hz,脉宽为75μs,时间为5min,再采用水热合成法对微弧氧化后的超细晶纯钛及普通纯钛进行水热反应形成TiO_2-HA复合膜层。将试件放入水热合成反应釜内,在1
应力应变传感器可以将外界刺激转化为可识别的信号,这种可识别信号不仅是二维电学信号,还包括可视化的光学信号。为了达到这种可视化目的,就需要向其中引入可视化变色材料。
在当今的互联网大数据时代,作为传递着重要信息的图像,对于人类社会的科研、教育、军事等各个领域都起着极其重要的作用,尤其随着5G技术的到来,这种作用更为明显。然而图像在
Ka宽带卫星通信是卫星通信的发展方向,卫星通信是应急通信的重要支撑,圆极化天线可以接收任意极化方向的电磁波,具有抗干扰能力强的优点因而在ka波频段卫星通信中被广泛应用。传统波导结构(微带传输线、矩形波导、基片集成波导和间隙波导等)设计的Ka波段圆极化天线增益较低不能满足使用要求,集成基片间隙波导具有更低损耗的优势,因此采用集成基片间隙波导设计圆极化天线。本文进行了如下的工作:1.设计了一个应用在K
随着网络资源的日益庞大和信息更新速度的飞速增长,适应特定领域、特定需求的个性化搜索急需主题爬虫技术的支持。为了提高主题爬虫的搜索质量,本文主要研究了主题模型的构建
目的通过对纯镁表面超声微弧氧化(UMAO),硅烷偶联载人乳铁蛋白(HLF),即形成UMAO-硅烷-HLF复合膜层,期望提高医用Mg在动物体内的早期骨整合能力及调控其降解速率。方法纯镁超声微弧氧化(UMAO)为对照A组,UMAO-硅烷为实验B组,UMAO-硅烷-0.1mg/ml的人乳铁蛋白为实验C组,通过扫描电镜观察植入前3组不同膜层纯镁骨钉的表面形态,分别将3组不同处理的镁骨钉植入新西兰大白兔单侧
在无线通信技术领域,由于距离限制、复杂信道条件约束及其他因素制约而产生的中继协作通信方案一直以来都是通信界研究的热点之一,如何保证信息在较长距离传输时具有良好的通信效率和传输准确性越来越受到广大学者们的关注。自Rudolf.Ahlswede等人提出网络编码(Network Coding,NC)和Shengli Zhang等人提出物理层网络编码(Physical-layernetworkcoding