【摘 要】
:
图像目标检测是一项应用广泛的计算机视觉任务,它为图像理解及许多复杂计算机视觉任务提供了基础。基于深度卷积网络的目标检测方法是当前热门的研究方向之一,从技术路线上主要可以分为一阶段模型和二阶段模型。前者平衡了速度与检测精度,在工业界应用广泛;后者追求检测精度,在各项视觉竞赛中名列前茅。本文研究基于经典的一阶段模型Single Shot Multi Box Detector(SSD)的框架展开。针对通
论文部分内容阅读
图像目标检测是一项应用广泛的计算机视觉任务,它为图像理解及许多复杂计算机视觉任务提供了基础。基于深度卷积网络的目标检测方法是当前热门的研究方向之一,从技术路线上主要可以分为一阶段模型和二阶段模型。前者平衡了速度与检测精度,在工业界应用广泛;后者追求检测精度,在各项视觉竞赛中名列前茅。本文研究基于经典的一阶段模型Single Shot Multi Box Detector(SSD)的框架展开。针对通用目标检测任务,对于如何在保持运行速度的前提下提高模型检测精度的问题展开了深入研究,主要内容如下:(1)提出了一种结合通道注意力机制的特征融合方法(The Reversed Fusion Block with Attention,A-RFB)。该方法以模块化的形式对一组分辨率相差一倍的高低层特征图进行融合,进而在卷积网络的后端形成一个反向的特征金字塔。在每一个特征融合模块中,首先使用反卷积操作扩张高层特征图,再与低层特征图做哈达马积(逐元素相乘),最后通过注意力机制网络对融合特征进行重标定。A-RFB将网络高层的抽象语义信息融入到低层的特征图中,提高了模型的检测精度,并显著改善了小目标检测的性能。本文通过结构原理分析和实验验证摒弃了一些可能冗余的操作,使A-RFB的结构简洁有效。结合A-RFB的SSD模型能够以仅损失5%FPS为代价获得检测精度的提高,在速度上远胜SSD作者结合特征融合提出DSSD(Deconvolutional Single Shot Detector),而且精度上只落后了0.1%。另外,本文实验还证明了A-RFB对使用轻量级的Dense Net和Mobile Net v2作为主干网络的一阶段模型同样具有提升检测精度的作用。(2)受图像分类领域的mixup数据增强方法启发,本文提出了适用于训练SSD框架下目标检测模型的混合数据增强方法。依据邻域风险最小化的原则,本文基于图像的线性插值通过特征变换后可以表达为标签向量的线性插值这一假设,通过混合叠加随机的两张训练图像,对不同类别的样本之间的领域关系进行建模,从而提高模型的泛化能力。本文通过分析实验结果和模型原理,提出了用混合系数对分类标签加权、保留真值边界框、设置混合阈值、结合随机裁剪等一系列训练规则。使用本文的混合数据增强方法,能够在不改变任何网络结构的情况下,有效提高模型的检测精度。同时使用A-RFB和混合数据增强可以将SSD的检测精度大幅提高,超过了一系列先进的SSD改进模型。
其他文献
连词教学在对外汉语教学中,其重要性是毋庸置疑的。近年来,我国对外汉语教学的研究从各个方面不断深入,在对外汉语连词教学的研究方面也取得了不错的成果。但是,大部分都是通
山东省苍山县新兴乡马楼村王凯章、江西省铅山县永平镇安洲小学陈水清、南昌县向塘镇东风路1号周新辉等来信询问春季大棚栽培辣椒的技术?中国农科院蔬菜花卉研究所甜椒、辣椒
水利工程在防洪、供水以及灌溉方面都有着十分重要的作用,并且水利工程进一步加快了当前社会可持续性发展脚步。与此同时,水利工程对生态环境所忠诚的负面反应也受到了各方面人
第一部分过敏性紫癜患儿血清高迁移率族蛋白B1的表达及意义目的:测定过敏性紫癜(HSP)患儿血清高迁移率族蛋白B1(HMGB1)水平,分析血清HMGB1与实验室指标的相关性,初步探讨HMGB1与HSP发病的关系。方法:纳入2017年12月至2019年12月在重庆医科大学附属儿童医院初诊为HSP患儿83例,其中45例无肾脏受累(A组),38例合并肾脏损害(B组),恢复期HSP患儿18例(C组),健康对
当今世界已进入信息时代,并迈向知识经济时代。对于我们的传统印刷业,信息技术也不例外地为其发展提供了极大的支持,并同时推动着印刷制造业的变革。随着印刷设备朝着全面的数字
黄柏(Phellodendron chinense Schneid.)是“三木药材”(黄柏、杜仲、厚朴)之一,采集的四川、云南、贵州、湖北等九个主产区共九份黄柏药材,通过高效液相色谱(HPLC)法测定盐
医务人员作为一个特殊的群体,从事的是与人的健康及生命密切相关的高技术、高风险、高探索性的工作,大多数的研究发现,当代医务人员处在巨大的压力之下,医务人员的心理健康水平较普通人低。女性医务人员在临床工作中占据人数比例较大,加之女性自身受社会传统角色的影响,她们面临着家庭和事业带来的双重压力。因此,本文以临床女医生为研究对象,充分调查临床女医生工作压力状况及其影响因素,具有一定的现实意义。本研究通过问
本文给出一种不必列出网络方程,通过观察直接由网络写出不定导纳矩阵,求出网络函数的方法.
目前,给伤病员献血,需要人们献血,在献血中也曾出现许多可歌可泣的故事。然而,随着现代科学的发展,一种取之不尽可代替人血的人工血出现了,这样,需要挽救病人的生命健康时,就
Overton 在[1]中对一般最优场址模型给出了一个具二次终端敛速的算法.但未能证明该算法的收敛性.本文在一定条件下证明了 Overton 算法具有全局收敛性.