基于多层特征与新候选框生成机制的目标检测算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:chenming88623
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人工智能是当下的热门主题,实现对图像智能化的理解与分析是其中一个重要领域。图像智能包括图像分类,图像分割,目标检测等。目标检测是进行场景内容理解等高级视觉任务的前提,广泛应用于无人驾驶、人脸检测、智能视频监控以及增强现实等任务中。近年来,随着大规模图像数据集的出现以及计算机计算能力的不断提高,深度学习技术在计算机视觉领域取得了巨大的成功,并且已经在目标检测领域广泛应用。但由于图像背景复杂,目标尺寸过小等因素使得最终的检测精度不够理想。基于以上原因,本文主要针对提高物体检测精度,进行多层特征与新候选框生成机制的方法研究。卷积神经网络在特征提取时往往采用最深层的特征信息,越深层的特征越抽象,语义特征越丰富,但会缺失一些物体的边缘特性,不利于物体的定位。因此,本文通过对卷积神经网络的各层特征进行研究分析,提出对相邻残差块的最后卷积特征层进行两两结合,对这些新生成的特征进行候选框的提取,丰富的特征表达提高了候选框的质量,同时采用了浅层卷积特征,更利于小物体的检测。除此之外,本文提出级联RPN的方式,将生成的候选框再次输入到RPN网络中,对候选框的位置进行精修,进一步提升候选框的质量。同时,在目标候选框生成的过程中,会产生大量负样本,造成样本比例不均衡,本文采取非极大值抑制方法限制正负样本比例,不仅加快了收敛速度,最后的检测精度也有所提高。为了进一步增强检测物体的分类效果,考虑到每个候选框与整个图像之间有所关联,本文使用全局上下文语境方法,将整个图像的卷积特征与候选框的特征图进行结合,最后的分类效果有较明显提升。本文主要在PASCAL VOC公开数据集上进行实验,并分别对提出的改进方法进行测试,通过实验结果,可以验证本文的改进方法都可以有效地提高最终的检测精度。
其他文献
随着计算机和互联网技术的迅速发展,图像/视频类型的多媒体数据已经成为了当前网络中传输与处理的主要数据之一。考虑到用户体验与实际应用的需求,多媒体类数据通常需要进行
随着各国工业发展,石油及石油产品的使用量迅速上升,同时,在石油开采和运输过程中所带来的油泄漏已成为目前威胁环境的一大因素。为了在溢油事故发生时能给应急处理提供有效的支持,国内外很多专家研究了溢油在水体中扩散和溶解等运动和变化形式,建立了不少溢油模拟与预测的系统。目前国内外多数的溢油建模与仿真都是针对海洋及入海口,然而内河溢油的模拟更为重要和复杂——内河河道窄、情况复杂,承载航运功能的同时为周边城市
随着网络和信息技术的发展,协议测试技术正变得日益重要。一个复杂的通讯系统用一系列明确的规则,称为协议,来定义系统的各个元素之间可能的相互作用。协议一致性测试是一个检验
随着SOA、Web服务和软件开发技术的发展,越来越多的软件以Web服务形式供用户使用。网络上服务数目和种类的增加及用户对服务 QoS要求的提高,服务安全、服务组合和服务可信性
未知环境的建模,是机器人感知能力和智能水平的一种体现。因此移动机器人的自主环境构建(通常称为地图创建)问题越来越受到各国研究者的重视。 本文首先介绍了地图构建的基
需求工程是软件工程领域的重要研究内容之一.自上世纪60年代软件危机出现以来,人们都致力于研究解决软件危机的办法.随着研究的逐步深入,人们意识到使用工程化的方法从事软件
计算机病毒对计算机安全和网络安全构成极大的威胁,随着变形病毒在网络上的飞速蔓延,传统防御病毒的手段和工具显示出越来越多的缺陷。其中最关键的问题是传统方法无法准确检
数据仓库技术是在数据模型、数据库和应用开发等技术不断进步的基础上发展起来的,其目的主要是对巨量数据进行分析处理进而提供决策支持。本质上,数据仓库是一个使用其自身数据
我们生活中使用的智能卡只有很少的硬件平台.它的存储空间也许只相当于1 K的RAM,16K的EEPROM和24K的ROM.所以Java卡技术设计的最大挑战是在保留足够的应用空间后将Java系统软
近年来,针对传统企业和关键部门的计算机应用仅停留在诸如文档处理、公文流转以及信息发布等简单业务层面上,越来越多的企业或部门要求将信息技术的应用扩展到工作流系统,本文研