基于轻量级主干网络的Anchor-free目标检测方法研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:flytraker
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习技术和计算机硬件的不断发展,基于深度卷积神经网络的目标检测技术相较于传统机器学习方法在准确性和实时性方面都取得了突破性的提升。尽管如此,大多数目标检测模型仍然依赖于高性能的硬件环境,这限制了目标检测技术在更多实时场景下的应用。近两年提出的基于关键点的目标检测方法即anchor-free方法如Corner Net、Center Net等避免了基于锚框的目标检测方法中大量与锚框相关的Io U计算,为目标检测模型的轻量化提供了新的线索。目前主流的anchor-free目标检测模型以Hourglass Net-104,HRNet等关键点检测网络作为主干网络,取得了超越anchor-based目标检测模型的准确率,但这些重量级主干网络极大地限制了模型的推理速度,其原本面向人体姿态估计等任务设计的网络结构也还有进一步针对目标检测任务优化的空间。基于上述讨论,本文首先提出了一种轻量级主干网络来适配anchor-free检测方法的高效性,然后基于该轻量级主干网络提出了一种实时目标检测模型,最后将目标检测模型应用于视频检索中,验证其在实际应用中的效果。主要研究内容包括:(1)提出了一种适用于anchor-free目标检测方法的轻量级主干网络。该主干网络针对高分辨率特征图和计算高效性进行设计,采用多分支结构在保证高分辨率特征图的同时提取多尺度特征,高效率的网络构造单元在保证精度的同时降低了计算量。在Image Net 2012图像分类数据集和MPII人体姿态估计数据集上的实验结果表明,本文提出的主干网络相较于其他主流轻量级主干网络具有更高的性能和效率。(2)基于轻量级主干网络和三元关键点检测头提出一种高性能的实时目标检测模型。本文采用的三元关键点检测头通过检测关键点来预测物体框,极大地减少了生成的候选框数量,提高了与Io U计算相关的后处理速度。在训练阶段,提出了一种特征软选择联合辅助训练策略来提高多尺度特征的利用率,特征选择网络只用于辅助训练,不会引入额外的计算代价。本文提出的实时目标检测模型在MS-COCO目标检测数据集上以49.5FPS的检测速度取得了30.7 mm AP的准确率。(3)提出了一种基于实时目标检测的视频检索方法。该视频检索方法首先采用标准帧检测器来过滤掉视频中相似度较大的帧,保留标准帧。然后采用本文的实时目标检测模型对标准帧进行预测,支持多种物体类别以及物体数量、位置等细粒度信息的检索。在6个不同类型的视频上的检索结果表明,本文提出的视频检索方法相比基线模型取得了150倍到306倍的检索加速比,同时保持了90%以上的检索准确率。
其他文献
商业银行等金融机构积极推进高水平的数字化转型,如何在这一转型过程中通过有效的治理手段实现可持续的转型发展成为关键。本研究基于价值创造理论,结合国内外商业银行转型实践,通过扎根理论法和案例研究法,提出“价值创造三维治理模型”,以及具有适应性的治理路径和治理对策。研究发现,商业银行数字化转型的治理目标是通过价值网络中不同主体间的协同和互动提升金融资源的优化配置效率和价值创造能力,实现价值创造体系的持续
期刊
本文基于2015—2020年沪深A股上市企业的数据,采用文本分析技术构建企业数字化转型和企业价值研究模型,实证检验数字化转型对企业价值的影响及其作用机制。研究结果表明:(1)数字化转型能够显著促进企业价值的提升;(2)数字化转型能够提升创新效率,且创新效率在数字化转型与企业价值之间起部分中介作用;(3)异质性分析表明,在东部地区、高市场化地区和低环境不确定性情境下,数字化转型对企业价值的促进作用更
期刊
人脸特征点定位是指自动定位人脸特征点位置的方法,在人脸检测、人脸识别和面部表情分析等领域有着十分广泛的应用。级联姿态回归在人脸特征点定位表现优异,该算法基于初始形状,利用回归器逐步回归,逼近人脸真实形状。然而,当人脸包含局部遮挡时,人脸特征变得不可靠,从而导致人脸特征点定位和遮挡检测准确率降低,甚至导致人脸特征点定位失败。针对以上问题,本文提出如下两个解决方案:1)针对局部遮挡导致人脸特征点定位准
学位
随着白天和晚上监视数据爆炸性的增长,跨模态行人重识别成为新兴的挑战。与只处理模态之内差异的传统的行人重识别相比,跨模态行人重识别遭受了由不同类型成像系统造成的额外的跨模态差异。因此提出红外图片着色的方法来消除模态差距。但是生成对抗网络的着色方法依然存在一些问题,本文就这些问题进行一些研究。最近的各种研究工作提出了各种生成对抗网络模型,以将可见模态转换为另一个统一模态,旨在弥合跨模态鸿沟。但是,它们
学位
随着大数据、人工智能等技术的发展,数字经济时代已经到来,传统企业的数字变革也是大势所趋。索菲亚是家居定制行业中最早进行数字化转型的企业,最终实现了智能制造以及流程信息全打通的愿景。文章以索菲亚为例,对其数字化转型的动因、路径以及企业的盈利、营运、偿债、成长能力和EVA指标进行分析,以期为其他企业进行数字化转型提供参考。
期刊
叶脉是支撑叶片生长、运输叶片所需养分与光合作用产物的重要结构。叶脉根据所处位置、生长趋势和宽度等因素可以将其分级,例如一级叶脉定义为从叶柄向叶尖延伸的最粗叶脉,叶脉层级相较于叶脉网络更能表征叶脉的特性。叶脉的层级分割对图像分类、叶片建模和分子育种等领域具有重大意义。然而,当前对叶脉的研究大多停留在叶脉网络,由于层级叶脉复杂难以定位,更能发掘叶脉的特性的叶脉层级却少有涉及。一方面各级叶脉在色彩、亮度
学位
生成一直是自动摘要领域的难题,现有的文本自动摘要方法在处理长文本的过程中,存在准确率低、冗余等情况。无法达到令用户满意的性能效果。主要问题有两点:其一,目前以卷积神经网络(CNN)/循环神经网络(RNN)为编码器的抽取式文本摘要模型,在进行长文本抽取时,模型对文本内容的理解不够,抽取效果极不稳定,无法抽取到长文本的主旨句。其二,目前单纯的抽取式摘要模型存在性能瓶颈,由于抽取式文本摘要的粒度过大,进
学位
近年来,生物医学领域研究取得飞速进展,大量携带研究成果的文献被发表。尽管有人力物力去手动整理这些文献中的信息,但仅仅依靠人力对信息进行更新远远跟不上文献发表的速度。与通用领域相比,生物医学文献的信息抽取存在大量的嵌套实体和重叠关系等问题。因此,如何准确的从大量生物医学文献中抽取出有价值的知识,是目前生物医学领域信息抽取的重大挑战。为此,本文研究了生物医学领域的实体识别和关系抽取。对于实体识别,本文
学位
近年来,得益于高性能计算机或分布式系统的超强计算能力,深度学习方法在计算机视觉相关问题上,尤其是对图像分类任务的研究,取得了长足的发展。然而,在实际计算操作或者现实生活中,出于安全或者隐私等方面考虑,常常面临难以获取样本或者图像样本量过少的问题,这在研究领域内被定义为小样本学习问题。而当涉及到小样本问题时,高性能的计算能力或是传统深度学习模型似乎显得力不从心。针对目前计算机视觉中的热门问题,本文对
学位
近年来,汽车产业在移动互联、大数据及云计算等技术的推动下不断向着智能化、网联化方向发展,车联网在支持城市交通系统中安全相关应用方面具有广阔前景。在车联网中,高效的信息传播可以让车辆更好地了解潜在的风险和交通异常,对于提高交通安全性和效率具有重大意义,因此目前有大量的研究集中在车辆间安全消息广播方法的设计上。然而,现有的安全消息广播方法往往基于当前的信道状态或网络拓扑结构进行消息传输,只考虑最小化安
学位