基于卷积神经网络的图像目标检测技术研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:ljh163com
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像目标检测是计算机视觉领域最重要,也最具有挑战性的难题之一,它为更高层次的视觉任务做准备。图像特征提取是图像目标检测的关键。卷积神经网络可以从大量图像数据中自动学习出目标检测所需的特征,避免了人工设计特征的复杂过程。并且可以适应目标平移、目标缩放、目标形变以及目标所处环境的变化。因此,基于卷积神经网络的目标检测算法正受到越来越多人的关注。但是现有的经典网络在检测多尺度目标,特别是小目标时仍然存在困难,本文针对这些问题对网络做改进,并将它应用于遥感图像飞机检测,说明本文的研究工作具有非常重要的理论研究意义和工程应用价值。本文主要研究基于卷积神经网络的目标检测技术,对Two-stage的目标检测器做改进,以提升它们对图像目标的检测效果。论文的主要工作和成果如下:1、针对卷积神经网络对小目标检测效果较差的问题。本文利用卷积神经网络不同层的多尺度特征,提出了一种构建语义金字塔特征的新方法,并用该方法构建了一个新的语义金字塔特征,目标候选区域的分类和回归都在该金字塔特征上进行,增强了算法对小目标的检测性能。2、针对传统卷积神经网络的目标候选区域特征过于简单的问题,本文利用卷积神经网络卷积层的跨层连接(Skip Connection),设计了一个新的特征提取模块,并将其放在语义金字塔特征之后,进一步提取目标候选区域的特征。实验证明,特征提取模块的加入使得目标候选区域的分类和回归更准确,提升了图像目标检测的准确率。3、由于Region Proposal Network(RPN)给出的目标候选区域与真值框之间存在偏差,使得目标候选区域经过Ro I Pooling后获得的特征只是目标自身特征的一部分,这给后续目标候选区域的分类和回归带来了困难。针对这一问题,本文提出一种名为Maxout R-CNN的目标检测方法,该方法通过丰富目标候选区域的特征,提升目标检测算法的性能。4、提出基于CNN多尺度特征融合和Maxout R-CNN的遥感图像目标检测方法。以飞机目标检测为例详细地讨论了用卷积神经网络检测遥感图像目标需要注意的问题,包括:图像的剪裁和锚的选取等。实验证明,本文提出的遥感图像目标检测方法对遥感图像的目标检测效果非常好,说明本文的研究工作不仅具有重要的理论意义也有很重要的实际应用价值。
其他文献
雷电脉冲威胁着通信基站的稳定运行,雷击作用下通信基站杆塔的精确电气参数,是针对通信基站设备抵御雷击能力分析研究中的重要电气参数依据,对精细化基站设备防护规格的制定
混凝土砌块具有质轻、高强及良好的隔热保温等优良特性,已经成为应用广泛的建筑材料之一,但是混凝土砌块的耐高温性能较差,利用CO2气体养护混凝土砌块,CO2能够与水泥颗粒及水
眼睛是人类获取信息和感知外部世界最重要的方式之一,它可以从外部世界获取大约83%的信息,眼睛的运动状态反映了人的视觉注意力,通过眼睛可以分析人的意图,了解人的行为。眼
油源断裂作为将下伏源岩生成的油气运移至上覆储层中成藏的主要输导通道,是本文的研究目标。但目前对油源断裂附近油气聚集部位和富集程度仍缺少定量的评价。所以,本文进行油
近年来,随着战场信息化程度不断提高,各类传感器采集的图像情报数量不断增加,图像情报目标检测和场景识别已经成为军事领域的研究热点。针对海量的图像情报数据,利用计算机提
随着机器人技术、生命科学工程和精密光学工程等领域的迅速发展,精密操控技术已经成为制约上述领域进一步发展的关键因素。机器人关节作为直接影响精密操控系统整体品质的核
β晶型聚丙烯具有更好的抗冲击性能、更高的热变形温度,近年来,受到了研究者的广泛关注。添加β成核剂是目前工业上制备β晶型聚丙烯最常用的手段,然而现有无机或有机小分子
合成孔径雷达(Synthetic Aperture Radar,SAR)成像技术突破了天气、光照等因素的限制,实现了全天时、全天候地高分辨率成像。当今,合成孔径雷达成像技术在国防军事、地质探测、
本文针对木55区块地质储层特点以及该区块在钻井施工过程对钻井液各项性能的具体要求,设计研发了该甲酸盐钻井液体系,并进一步明确了该甲酸盐钻井液体系的工作原理。在室内通
大型油气藏的形成,除了要有充足的油气资源供给、良好的储集层和有效的输导通道外,盖层封闭油气的能力更为重要,只有在这样的条件下,进入圈闭中的油气才能得以聚集,并保存下