基于特征金字塔结构的目标检测算法研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:yuany06
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测作为当下计算机视觉领域的研究热点,也是计算机视觉领域中最重要最具挑战性的基础任务之一,其在自动驾驶、安防监控、缺陷检测等领域发挥着重要作用。近年来通过大量学者的理论研究,目标检测领域有着长足的进步。但在对小目标物体的检测、网络对尺度变化的适应性和网络对特征的表达能力上还有一定的提升空间。针对上述问题,本文通过分析基于特征金字塔结构的双阶段目标检测算法的基本原理,在特征提取网络结构和特征融合结构上进行改进,提出一种对目标尺度、场景变化和边界形变具有强鲁棒性的可变多尺度特征感知网络Deformable Multiscale Feature Perception Network(DMFPN)。其中主要工作内容如下:(1)可变多尺度特征感知网络。针对小目标问题和目标检测任务的基本要求,为后续检测任务提供更高分辨率的特征图,本文在ResNet50网络基础上进行改进,骨干网络底层增加通道加空间注意力机制,网络深层改进残差瓶颈模块结构并减少整个网络的池化次数,增强细节信息并保证检测任务在较高分辨率特征图上进行。设计了一种可以提取并融合多尺度特征的可变多尺度特征融合模块,对参加构建特征金字塔结构的特征图进行处理,提升网络对尺度变化的鲁棒性。(2)基于双向特征金字塔结构和联合归一化方法的目标检测算法。在原始特征金字塔Top-down结构基础上增加Bottom-up结构,增加特征金字塔结构对细节信息的传递,并将全局感受野信息作为引导信息对低层特征图信道进行加权,改进特征金字塔中涉及到的上采样操作。网络底层通过改变骨干网络中归一化层结构,联合使用批归一化和实例归一化,提升网络对颜色、亮度、风格上的鲁棒性,降低同类别不同个体之间的外观差异,过滤复杂的外观变化,提升网络输出模型的泛化能力,加快模型收敛速度。(3)为验证本文算法的有效性,在Pascal VOC数据集上进行算法验证,并将网络结构输出进行可视化分析。本文算法在Pascal VOC数据集得到82.30%的平均精度,在客观评价指标下将本文结构与不同算法进行定量对比并与原始算法进行主观视觉效果比较。
其他文献
作为现代传感器系统的核心关键技术,多平台信息融合与目标跟踪技术在航空航天、战略预警、定位与空天监测、公共安防等军民领域已广泛应用。伴随着高速实时信息处理和多目标
非常规油气资源作为常规油气资源的替代能源,具有重要的开采价值。非常规储层通常具有低孔低渗的特征,需要借助水力压裂技术形成不规则、延伸方向复杂的网状裂缝以提高储层的
量子光学和量子信息领域中有很多基于量子纠缠的研究。从最开始的冯诺依曼熵,到近来的共生纠缠度、部分转置矩阵的负本征值等概念的相继提出,人们对量子纠缠有了进一步理解,
在此企业改革大方向下,生产调度系统作为企业生产系统重要的环节之一。一方面应当继续发挥生产调度系统在降低企业生产成本、缩短生产周期、提升生产效率,以及优化资源配置等
目的:评价股骨后髁偏心距和胫骨后倾对全膝关节置换术后膝关节屈曲活动度的影响。材料与方法:于2013年7月-2013年12月,对16例(20膝)使用后稳定假体的全膝关节置换术的患者进
会议
多导弹协同制导是未来信息化战争的重要手段,而以时间协同为基础的多导弹齐射攻击,更是敌方反导系统的巨大威胁,其主要目的是使利用饱和攻击的战术使敌方反导系统无法一一应
复杂网络的研究逐渐渗透到数学、物理、生物工程等诸多领域,对其动力学性质的分析受到了相关领域学者越来越多的关注.在实际应用中,有许多以动力系统为代表的复杂网络模型,如
线性回归是监督学习的一个基本问题,具有丰富的理论基础并广泛应用在医疗、统计、教育等方面。传统线性回归模型通常考虑向量结构的协变量。当问题的协变量具有矩阵结构时,需
随着计算机技术的不断进步,目标跟踪技术不断完善并且在视频监控,无人驾驶等方面有着广泛的应用,是当前计算机视觉领域的一个热点。目标跟踪算法在背景或相似物体干扰的情况
2003年,《普通高中语文课程标准(实验)》颁布,新课改开始实施;2017年,《普通高中语文课程标准(2017年版)》又进一步修改和更新。遵循新课改标准,高中语文课堂展开了一系列提