基于全局上下文的目标检测方法

来源 :吉林大学 | 被引量 : 1次 | 上传用户:YOLANDA123456789
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是计算机视觉领域很多下游任务的基础,它的目标是识别出图片中所包含的物体实例并定位它们的位置。两阶段检测方法是基于深度学习的目标检测框架的重要分支,它们先生成可能包含目标的感兴趣区域(RoIs),然后提取出RoIs内部的视觉特征来完成检测。每个RoI的有效感受野往往比较小,使得检测时使用的RoIs的视觉特征是局部的,缺乏全局上下文依赖,不可避免的造成噪声误检以及外观特征不明显物体的漏检。现有工作一般通过建模物体之间的语义和空间关联来捕捉上下文依赖,忽视了物体和环境之间的依赖关系。基于此,本文提出了一个全局上下文依赖网络(Global Contextual Dependency Network,GCDN),利用全局上下文从整体的角度去捕捉上下文依赖。GCDN自适应的为每个RoI学习对应的上下文特征,作为原有局部视觉特征的补充,增强了两阶段检测器的识别能力。GCDN包含两个模块,上下文表示模块(Context Representation Module,CRM)和上下文依赖模块(Context Dependency Module,CDM)。针对全局上下文缺乏空间信息,CRM基于全局上下文生成多尺度上下文表示,将尺度等空间特征融入到视觉特征中。为了建模物体和上下文表示之间的依赖,CDM使用注意力机制建模RoIs和上下文表示中各个位置之间的依赖程度,根据依赖程度聚合上下文表示中的信息。为了减少计算量,本文还设计了一个轻量化版本的上下文表示模块。在目标检测基准数据集MS-COCO 2017上,本文选用多个两阶段检测器作为基线模型,将GCDN作为即插即用的组件嵌入到基线模型中进行实验验证。使用Res Net-50作为Backbone,GCDN分别为Feature Pyramid Network(FPN),Mask R-CNN和Cascade R-CNN带来了1.5%,1.2%和1.0%的AP值提升,表明本文模型为基线模型带来了持续且显著的效果提升,验证了GCDN的有效性和泛化性。消融实验和轻量化实验表明本文设计的两个模块独立发挥作用并且互相补足对方。
其他文献
随着地下煤层开采深度增加,岩层控制难度加大,区段煤柱受到水的物理化学作用,在开采作用下易发生失稳,造成生命财产损失。因此,开展在采动作用下含水区段煤柱的稳定性研究,对煤矿的安全生产具有重要理论意义和实际应用价值。以实际煤矿开采工作面为背景,对不同含水率型煤试件进行单轴压缩及巴西劈裂实验,利用尖点突变理论与有限元数值模拟分析方法,对采动作用下含水区段煤柱的稳定性进行研究,主要工作与成果如下:(1)通
学位
深度学习的概念一经提出,便引发了人工智能领域的发展狂潮,尤其在自然语言处理领域中,其影响极其深远。对于自然语言处理任务而言,仅依靠传统模型与数据标注结合的方法无法做到语义的精准理解。想要准确深入地理解语义,必须将先验知识融入到自然语言处理任务中。实践证明,知识指导的自然语言处理是未来发展的必由之路。随着研究的深入,知识图谱得到了广泛的应用,尽管如此,知识图谱依然面临着覆盖度不完整等问题。为了提高知
学位
变分推理是计算后验分布的一种常用方法,因其收敛速度快、理论基础扎实,在机器学习中发挥着核心作用。传统变分推理假设变分分布为平均场形式(Mean-field),即隐变量之间相互独立,这种理想化假设虽然可以简化优化过程、提高计算可行性,却忽略了隐变量之间的后验相关性(后验依赖关系),对具有变量相关性的模型来说并不适用。Copula变分推理(Copula Variational Inference,CV
学位
阐述光伏电池在焊接的过程中的电池片、焊接材料、焊接设备、焊接工艺,以及它们之间的匹配影响,以及对焊接质量的影响。
期刊
当前网络上存在着海量的、多源的无结构化文本数据,如何从中快速提取用户感兴趣且有用的内容是亟待解决的问题。研究者们提出使用自动化工具将无结构化数据转化成结构化数据的概念,关系抽取是其中至关重要的步骤之一。根据数据集的标记程度可以将关系抽取分为有监督、半监督、无监督。针对有监督关系抽取即关系分类的相关算法研究有很多,主要集中于使用深度神经网络抽取待分类句子自身的语义特征,且均已取得了不错的性能效果。随
学位
经过近年来的快速发展,现有的深度学习技术已在图像分类领域展现出强大的性能,但这往往需要大量的标注样本对模型进行训练。而在很多现实场景中,有标注的样本通常是稀缺且昂贵的。为解决此问题,人们提出了元学习(Meta-learning),期望仅使用少量的标注样本就能得到令人满意的效果,相关研究对医疗、行人再识别等缺少标记样本的领域有着重要的现实意义,元学习也是深度学习领域研究的热点之一。元学习的主要思想是
学位
煤矿巷道在服务期限内受周围采掘活动等影响,产生顶板下沉,或片帮,或底臌等变形破坏,导致不能正常使用时,必须进行扩修。扩修过程中,巷道围岩应力重新分布,可能诱发冲击地压。本文针对这一问题,通过时变力学理论对巷道扩修诱发冲击地压的时变机理进行了以下几个方面的研究:(1)对煤岩试件-试验机系统、顶底板-煤柱系统、巷道围岩系统这三类煤岩时变系统进行了时变动力分析。通过弹塑性分析得到圆形巷道冲击地压发生条件
学位
目前国内增强型地热系统(EGS)项目存在勘查程度低、换热技术不足、高温钻井成本高、具有诱发微地震风险等工程瓶颈问题,以上均与储层参数和不同注采参数下热储层热采性能变化规律认识不清密切相关。为此以松辽盆地北部大庆地区花岗岩热储层为研究对象,首先通过实验方法测定松辽盆地花岗岩在不同高温下物理力学和渗透率等参数,然后将实测参数导入多物理场耦合数值软件中,建立温度渗流耦合模型,数值模拟得到了注入温度、生产
学位
本文简要介绍了甘肃省耕地质量现状和面临的形势与问题,阐述了耕地质量提升的重大意义,提出甘肃省耕地质量建设与保护工作要坚持绿色发展新理念,建议以耕地保护为中心,建设耕地质量监测和管理信息系统平台,实施有机质提升、中低产田土壤改良、盐碱地改良工程等三大工程,推动甘肃省耕地质量建设与保护工作深入开展,为确保粮食安全、实现绿色高质量发展奠定基础。
期刊
本文研究了层状岩体界面裂纹应力强度因子的测试方法。层状岩体界面层内部存在着粘结性较小的原生软弱层,因此层状岩体的破坏,不仅体现为单一层面内部的裂纹扩展,更多的是界面层的破坏。应力强度因子的准确评价可以用来判断界面裂纹是否发育以及扩展的方向,对于预防和控制因裂纹扩展而引起的事故,具有十分重要的的理论意义以及实际价值。层状岩体由不同力学性质的岩石材料组合而成,因此将界面力学思想应用于层状岩体中。为了得
学位