基于深度学习和上下文的目标检测算法研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:SuperMMX
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是计算机视觉领域中一项基础但极具挑战性的任务。传统的目标检测方法包括区域选择、提取特征、分类回归三个操作。这其中存在的问题主要有:第一人工提取的特征鲁棒性不好;第二提取候选区域的方法效果并不理想而且时间复杂度很高;第三不能实现端到端的训练和测试。随着深度学习技术的发展,目标检测算法也从基于手工特征的传统算法过渡到基于深度神经网络的检测算法。在日常场景中人类与计算机对于目标的识别与检测可能有着不一样的语义表达,但借鉴人类视觉识别任务中对于上下文信息的应用,利用上下文信息对目标检测方法的提升和改进有着重要的意义。本文在目标检测任务中显式地建立模型,对输入图像的上下文信息进行提取和深入分析讨论。在基于特征金字塔网络(Feature Pyramid Networks,FPN)的基础上,提出了利用上下文信息来提升目标检测准确率的几种改进方法。本文的主要工作如下:(1)全局上下文信息提取。在FPN目标检测算法的基础上,通过分别引入聚合激励模块(Squeeze-and-Excitation block,SE block)和全局上下文模块(Global context block,GC block)来对算法进行改进。SE block通过提取多尺度特征的全局信息,利用门控函数选择性地抑制冗余的特征通道,从而实现特征图特征通道的自适应校准。GC block通过捕捉特征长距离的依赖性来提取上下文信息,从而对特征起到补充语义信息的作用。同时,本文在GC block的基础上经过改进,引入特征尺度自适应选择的思想,提出了一种新的全局上下文信息提取模块,命名为选择性全局上下文模块(Selective global context block,SGC block)。(2)多尺度上下文信息提取。在多尺度特征融合网络中,通常把高层特征融合到低层特征,从而使高层的语义信息补充到低层特征。而本文提出了一种新的特征融合模型DFPN,在自顶向下的特征融合网络基础上,引入新的自底向上的特征融合支路,使多尺度的上下文信息更丰富,最后把两路的融合特征进行结合,使特征提取网络拥有更好的特征表示。同时本文将SE block、GC block和SGC block分别嵌入到DFPN网络当中,从而将提取到的全局上下文信息融入到模型里面。(3)在Pascal VOC 2007和Pascal VOC 2012公开标准数据集上,本文对所提出的基于上下文信息改进的目标检测模型进行了训练和测试。实验结果表明,本文提出的全局上下文信息提取网络和多尺度上下文信息提取网络均能有效地提升目标检测任务的检测精度,同时本文提出的DFPN模型在小目标检测精度上具有很好的提升效果,而且在复杂的目标检测场景中对遮挡物体、小物体和密集物体的检测具有更好的鲁棒性。
其他文献
在电磁诱导透射的模型中,暗态极化子中的光场和原子激发场之间的比例可以通过作用在原子系综中的耦合光光强来调节。因此光场可以在缓慢关断耦合光的过程中,通过绝热过程转变
目的:本研究在图片有助于听障学生理解书面语言理解的研究基础上,采用图文结合的方式,对听障学生抑郁、焦虑、强迫、人际敏感、敌对五个方面,编制一份专门针对听障学生心理状况特点的心理健康问卷,为听障学生心理健康评估提供可靠的评估依据。方法:(1)通过文献综述、专家咨询等方法,初步确定问卷结构由抑郁亚量表、焦虑亚量表、强迫亚量表、人际敏感亚量表与敌对亚量表组成。(2)选取74名听障学生以总分相关法进行项目
学位
我们通过生成函数和纠缠交换的方法研究了混态情况下小世界网络的纠缠渗流,通过理论计算和数值模拟,分析了小世界网络平均集团的大小和路径长度的关系,可以得出小世界网络在
滚动轴承的应用范围极广,作为旋转机械设备的重要组成部分,却也是最容易受损的部件之一,它的健康状态会直接决定整个机械设备能否正常运行。因此,在机械故障监测与诊断领域内,提高对滚动轴承故障监测的有效性尤为重要。特别是在发展迅速的现代化机械设备中,各个零部件之间的配合由于结构的复杂化、自动化、高速化,也变得更加紧密,更是加大了滚动轴承发生故障的可能性。传统的故障诊断方法是通过现有的经验知识对检测到的故障
车间调度属于制造过程里的一重点环节,作业车间调度在调度问题里是比较典型的。本文以作业车间为研究对象,针对产品制造系统具有动态性、随机性和不确定性等特点,结合复杂网
高次谐波(HHG)产生于强场与物质相互作用。它对阿秒脉冲的产生,电子结构信息的获取,目标物质(原子、分子、固体、纳米材料)的动态信息的获取至关重要。本文主要用Lewenstein理论
2016年12月23日,财政部颁布了 12项中国注册会计师审计准则,其核心准则《中国注册会计师审计准则第1504号—在审计报告中沟通关键事项》提出要在新的审计报告中列示关键审计事项。2016年93家A+H上市公司进行了新审计报告改革试点,自愿披露了关键审计事项。2017年年报开始全面执行关键审计事项准则,迄今已有两个完整报告年度,但新审计准则的执行情况及其政策效应有待探索。本文在对关键审计事项准则
基于智能制造的时代背景,传统的设计方法已经不能满足现在产品创新设计的需求。搅拌运输车在道路、桥梁和楼房建设中起到了重要的作用。搅拌运输车的使用中经常面临着进料斗损坏、滑料槽损坏等问题。因此整合出现有产品设计方法与技术,对多门学科进行交叉,结合技术研究进行探究,期望探索出能够有效满足用户需求的产品创新设计程式。因此,本文探索集成多种设计方法与技术,创新设计出对搅拌运输车进出料斗、滑料槽残留混凝土能够
随着科学技术的日益发展,遥感图像作为记录地貌特征的特殊图像,其应用范围逐步扩大。遥感图像的成像和传输过程受一些因素的干扰包括大气辐射、成像设备等,导致得到的遥感图
含有兴奋性和抑制性突触可塑性的皮层神经网络,是大脑完成多种行为和功能的生理基础,研究两者对神经网络的共同调控作用,对理解大脑神经回路的发育和运行机制具有重要意义。脉冲时间依赖可塑性(Spike-timing-dependent plasticity,STDP)是一种神经系统中较为常见且有关键作用的突触可塑性,STDP可通过对突触连接权重的调节,改变神经网络的连接结构,进而调节神经电活动的状态。已有